- 2025/02/12 多头自注意力的计算量 2036
- 2024/04/19 Transformer 中正弦位置嵌入的单调区间 2798
- 2024/04/18 Transformer 中位置嵌入的一个关键性质 2211
- 2024/04/16 Transformer 中的层归一化 2408
- 2024/04/15 LayerNorm 层后接 Linear 层的转化形式 2139
- 2024/04/03 交叉熵损失中隐藏着一个 Embedding 层 2169
- 2023/12/28 交叉熵损失函数与三元组损失函数之间的关系 2470
- 2023/12/14 CPU 上深度学习推理引擎速度比较 3069
- 2022/10/25 sklearn 中 GMM 的 predict_proba 输出的是什么概率 3997
- 2022/03/21 平顶激光截面数学模型参数求解 3590
- 2022/03/17 [生活随笔] 春寒料峭和昆虫识别 4436
- 2022/03/14 [生活随笔] 葡萄生日 3682
- 2022/03/13 [生活随笔] 周末小纪: 整理文件 3395
- 2022/03/12 卷积层的参数量和计算量 3510
- 2021/12/26 C/C++之无符号数和有符号数的定义, 关系及转换 3307