- 昨日不在
- 12/8手写大模型组件之Group Query Attention,从 MHA -> MQA -> GQA
- 11/9LoRA 原理和 PyTorch 代码实现
- 10/15普通人从零开始做公开表达的增长策略
- 10/6LLM 大模型训练-推理显存占用分析
- 8/30项目隔离,不同的项目使用不同的 Git 配置
- 8/18手写 transformer decoder(CausalLM)
- 8/18手写 Self-Attention 的四重境界,从 self-attention 到 multi-head self-attention
- 8/14工作,再坚持坚持
- 6/8与朋友聊天——大宇篇
- 5/2如何在字节工作六个月以上且保持一定的心理健康?
- 1/12023,新的开始
- 12/312021,乌云与曙光
- 10/31Life Influenced By Point
- 10/6How I Met Bruce?
- 8/21和崔同学日常段子集锦
- 6/10倒排索引原理与python实现
- 5/30我没想到我会误入相亲素材
- 5/29崔同学视角的「我没想到我会误入相亲素材」
- 4/17香格里拉封闭培训的七天
- 4/15《弗兰克扬小说合集》
- 4/14《白非立上进记合集》
- 4/5洗澡
- 4/4一个粉丝的自我修养
- 3/27三月末的陈词
- 3/15翻页了
- 3/10三月的三分之一
- 2/28我的黄金时代已经过去
- 2/19我从没这么喜欢待在家里
- 2/10NER上分利器:实体边界重定位
- 1/28周四,又见周四
- 12/312020年过去了,我不怀念它
- 12/19BBruceyuan的近期不靠谱事件
- 11/20倒着写的文章
- 10/16我不喜欢失眠
- 9/20我为什么没有令我满意的offer
- 8/15Python实现蓄水池算法
- 8/3简单方法增加Query召回的多样性
- 8/201之间均匀分区取两点构成三角形的概率-证明加代码实现
- 6/13Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction (中文介绍)
- 6/12记EMNLP2020投稿
- 6/12Must-read Papers on Emotion-Cause Pair Extraction(achieved)
- 3/12关于隐马尔可夫模型(HMM),需要知道什么?
- 3/7深度学习时代,分词算法的真实应用实例
- 3/62020年了,还有必要学习分词算法吗?