Seq2Seq模型与encoder-decoder架构(附代码实现一个小小demo) 前言 学习解码器与编码器架构以及注意力机制是为了后边更好的学习Transformer架构。本文为作者学习encoder-decoder架构的学习笔记。 encoder-decoder架构 诞生背景 &…
|
526
|
|
4313 字
|
22 分钟
LSTM小结 LSTM所解决的问题(LSTM解决了RNN的什么缺陷?) LSTM的全名是:Long Short-term Memory(LSTM),即长 短时记忆神经网络。我们知道LSTM是一种特殊的RNN,那他相较于RNN改…
|
431
|
|
3815 字
|
15 分钟
循环神经网络小结 RNN所解决的问题 RNN是专门处理具有序列关系的输入数据而诞生的网络,它能挖掘数据中的时序信息以及语义信息 序列关系数据 什么是具有序列关系的数据呢? 主要就是符…
|
821
|
|
3997 字
|
16 分钟
竟然有通过GPT来访问我的,哈哈哈 何德何能也是污染上GPT的信息源了。

有没有不存在bug的支持wordpress渲染latex数学公式的工具或插件啊!试了一堆插件,‘要么渲染不全 ,要么跟本不渲染,不能每次都一个一个检查,渲染不到的放图片吧。。。
两年前就因为这个问题困扰过,两年过去了还没解决┭┮﹏┭┮
反向传播小结 前言 之前也学习过反向传播,大概知道反向传播是为了更新权重,但是从来没想过一个问题,这个更新权重的行为的对象是什么?是一个样本?还是一批样本?这些都没想过,还有就是反向传播算法优化的是什么?在反向传播出现之前,都…
|
747
|
|
2215 字
|
9 分钟
好痛啊。从来没有过的情绪。为什么我无法控制我的情绪
好痛啊。

2024.3— 2025.3:考研流水账 结果 在前天的时候,就受到了拟录取的消息。在得知这一瞬间消息的时候,并没有之前幻想过无数次拟录取场景那么的开心,也没有流泪,只是有一丝兴奋,接着给家人朋友分享了这个消息。之后剩下的感觉就是略显迷茫。可能是一步步走…
|
1,016
|
|
1626 字
|
7 分钟
距离25考研已经过去整整两周。这两周的时间格外长,与备考期间的两周时间的流速相比天差地别。经过这10个月的备考生活。心态大有变化。这期间我想过去干很多事情。我一直也是一个脑子里突然就会有很多想法的人。只不过之前特别容易一时兴起,坚持不了多久。但是考研期间我连一时兴起的机会都没有。所有脑子里突然想去做的事情都得给考研让步。我一直是明白的,随着年纪的增长,这种情况只会越来越多直到完完全全我没有一点时间去干自己脑子中一时兴起的一件事情(除非我能财富自由)。而考研让我真真切切感受到这种无力感。道理我都懂,没经历过是真的不知道痛。但好在还有时间。
考研,我一辈子第一次这么为自己而拼。没有人催,没有人管,全凭自觉。不管结果如何。就继续向前大步走吧。接下来就是去实现我那些一时兴起脑子中的东西。这次不要一时兴起了。
永远相信美好的事情即将发生