城市的夜晚总是比白天更诚实。街角的便利店灯光惨白,关东煮的热气在玻璃上晕开一片模糊的水雾。推门进来的人,大多带着一身疲惫,眼神里藏着不想对人言说的故事。
我坐在靠窗的位置,看着窗外偶尔驶过的出租车。司机们在这个巨大的钢筋森林里穿梭,像是在寻找出口,又像是在逃离什么。我们都是这城市里的未眠人,靠着一点微温的食物,慰藉着空荡荡的胃和心。
光影是城市的灵魂
把风花雪月装进口袋
生活中的只言片语
城市的夜晚总是比白天更诚实。街角的便利店灯光惨白,关东煮的热气在玻璃上晕开一片模糊的水雾。推门进来的人,大多带着一身疲惫,眼神里藏着不想对人言说的故事。
我坐在靠窗的位置,看着窗外偶尔驶过的出租车。司机们在这个巨大的钢筋森林里穿梭,像是在寻找出口,又像是在逃离什么。我们都是这城市里的未眠人,靠着一点微温的食物,慰藉着空荡荡的胃和心。
下雨天躲进书店是一种特权。隔绝了外面的潮湿和喧嚣,纸张的味道混合着淡淡的咖啡香,让人感到莫名的安稳。
随手翻开一本旧书,扉页上写着:"送给2018年的自己"。不知道那位陌生人后来去了哪里,是否成为了想成为的人。书是时间的容器,我们在这里相遇,又在各自的时间线里继续前行。
AI 探索与工程实践
Temperature 是控制大模型输出随机性的关键参数。当 Temperature 接近 0 时,模型倾向于选择概率最高的 Token,输出趋于确定和保守;当 Temperature 升高时,低概率 Token 被选中的机会增加,输出更具创造性。
def sample(logits, temperature=1.0):
if temperature == 0:
return np.argmax(logits)
# Apply temperature scaling
scaled_logits = logits / temperature
probabilities = softmax(scaled_logits)
# Sample from the distribution
return np.random.choice(len(logits), p=probabilities)
在实际产品中,对于代码生成等严谨场景,通常设置 Temp < 0.2;而对于创意写作,Temp > 0.7 往往能带来惊喜。
通用 Embedding 模型在垂直领域往往表现不佳。通过对比学习(Contrastive Learning)对 Embedding 进行微调,可以显著提升检索召回率。
关键在于构建高质量的正负样本对。正样本可以是(Query, Relevant Doc),负样本则通过 Hard Negative Mining 挖掘那些与 Query 相似但不相关的文档。
从 Demo 到生产环境,RAG(检索增强生成)面临诸多挑战:
1. 文档切分策略:简单的固定长度切分往往破坏语义,基于语义的切分或多级索引是更好的选择。
2. 引用归因:如何精准地告诉用户答案来自哪一段原文,是建立信任的关键。
3. 延迟优化:检索+重排序+生成,整个链路的耗时需要通过并行化和缓存来优化。
用脚步丈量世界
三月的双廊,阳光好得让人想流泪。洱海蓝得深邃,像一块巨大的蓝宝石镶嵌在苍山脚下。住在海边的客栈,每天醒来第一件事就是拉开窗帘看海。
在这里,时间仿佛失去了意义。没有打卡任务,没有行程表。只是坐在露台上发呆,看云卷云舒,看光影在海面上变幻。偶尔有海鸥掠过水面,激起一圈圈涟漪。原来生活可以这么慢,慢到能听见自己的心跳。
"不去天堂,就去雨崩。" 这句话骗了多少人,也治愈了多少人。进山的路上,身体在地狱,每一步都在挑战极限;但当看到神女峰在夕阳下泛起金光的那一刻,觉得一切都值了。
在冰湖边,由于海拔过高,呼吸变得急促。四周是亿万年的冰川和巍峨的雪山,人类在自然面前显得如此渺小。那一刻,内心的杂念都被洗净,只剩下对自然的敬畏。
AI 产品经理 · 计算机硕士
项目1:AI 知识库问答系统(零代码平台)
项目2:AI+医疗影像辅助诊断系统