扫街随拍

光影是城市的灵魂

云南旅图

把风花雪月装进口袋

写作碎片

生活中的只言片语

深夜食堂与未眠人

2024年12月15日 · 随笔

城市的夜晚总是比白天更诚实。街角的便利店灯光惨白，关东煮的热气在玻璃上晕开一片模糊的水雾。推门进来的人，大多带着一身疲惫，眼神里藏着不想对人言说的故事。

我坐在靠窗的位置，看着窗外偶尔驶过的出租车。司机们在这个巨大的钢筋森林里穿梭，像是在寻找出口，又像是在逃离什么。我们都是这城市里的未眠人，靠着一点微温的食物，慰藉着空荡荡的胃和心。

雨天的书店

2024年11月03日 · 感悟

下雨天躲进书店是一种特权。隔绝了外面的潮湿和喧嚣，纸张的味道混合着淡淡的咖啡香，让人感到莫名的安稳。

随手翻开一本旧书，扉页上写着："送给2018年的自己"。不知道那位陌生人后来去了哪里，是否成为了想成为的人。书是时间的容器，我们在这里相遇，又在各自的时间线里继续前行。

技术笔记

AI 探索与工程实践

LLM 温度采样的本质

Temperature 是控制大模型输出随机性的关键参数。当 Temperature 接近 0 时，模型倾向于选择概率最高的 Token，输出趋于确定和保守；当 Temperature 升高时，低概率 Token 被选中的机会增加，输出更具创造性。

def sample(logits, temperature=1.0):
    if temperature == 0:
        return np.argmax(logits)
    
    # Apply temperature scaling
    scaled_logits = logits / temperature
    probabilities = softmax(scaled_logits)
    
    # Sample from the distribution
    return np.random.choice(len(logits), p=probabilities)

在实际产品中，对于代码生成等严谨场景，通常设置 Temp < 0.2；而对于创意写作，Temp > 0.7 往往能带来惊喜。

Embedding 微调实战

通用 Embedding 模型在垂直领域往往表现不佳。通过对比学习（Contrastive Learning）对 Embedding 进行微调，可以显著提升检索召回率。

关键在于构建高质量的正负样本对。正样本可以是(Query, Relevant Doc)，负样本则通过 Hard Negative Mining 挖掘那些与 Query 相似但不相关的文档。

RAG 产品化的挑战

从 Demo 到生产环境，RAG（检索增强生成）面临诸多挑战：

1. 文档切分策略：简单的固定长度切分往往破坏语义，基于语义的切分或多级索引是更好的选择。
2. 引用归因：如何精准地告诉用户答案来自哪一段原文，是建立信任的关键。
3. 延迟优化：检索+重排序+生成，整个链路的耗时需要通过并行化和缓存来优化。

旅行日记

用脚步丈量世界

大理双廊：时间的褶皱

2025.03 · 云南

三月的双廊，阳光好得让人想流泪。洱海蓝得深邃，像一块巨大的蓝宝石镶嵌在苍山脚下。住在海边的客栈，每天醒来第一件事就是拉开窗帘看海。

在这里，时间仿佛失去了意义。没有打卡任务，没有行程表。只是坐在露台上发呆，看云卷云舒，看光影在海面上变幻。偶尔有海鸥掠过水面，激起一圈圈涟漪。原来生活可以这么慢，慢到能听见自己的心跳。

雨崩徒步：眼睛在天堂

2024.10 · 梅里雪山

"不去天堂，就去雨崩。" 这句话骗了多少人，也治愈了多少人。进山的路上，身体在地狱，每一步都在挑战极限；但当看到神女峰在夕阳下泛起金光的那一刻，觉得一切都值了。

在冰湖边，由于海拔过高，呼吸变得急促。四周是亿万年的冰川和巍峨的雪山，人类在自然面前显得如此渺小。那一刻，内心的杂念都被洗净，只剩下对自然的敬畏。

简历

AI 产品经理 · 计算机硕士

清华大学 (Tsinghua University)

2021.09 - 2024.06

计算机科学与技术（人工智能方向） · 硕士

核心课程：机器学习（94/100）、自然语言处理（91/100）、计算机视觉（89/100）、产品设计与验证（93/100）
研究课题：《基于多模态大模型的智能客服对话管理系统》（导师：李航团队），获国家奖学金
技术实践：主导 Kaggle “AI+医疗影像分类”竞赛，Top 3%（团队贡献：数据标注方案设计+模型蒸馏优化）

某头部自动驾驶公司

2024.03 - 至今

AI 产品经理

技术架构决策：主导车载多模态交互系统选型，对比 Llama2-70B+RAG 与 GPT-4 Turbo 方案，最终采用混合架构实现推理成本降低 40%，响应速度提升至 <3秒（日均处理 10万+ 次交互）。
场景化功能设计：
- 开发“多轮导航纠偏”功能：通过用户轨迹数据挖掘高频纠偏场景（如立交桥、隧道），设计 3步意图澄清流程，减少无效交互 37%。
- 构建“车内多设备协同”系统：打通手机/车机/智能家居 API，实现语音指令跨设备执行（如“关闭客厅空调”），用户 NPS 提升 28分。
商业化落地：
- 推动与蔚来汽车合作，车载语音助手 DAU 突破 50万，功能使用率从 22% 提升至 61%（行业 Top 3 水平）。
- 设计 B端客户定制方案：针对物流企业开发“疲劳驾驶监测+语音播报”模块，单客户 ARR 超 200万元。

某 SaaS 独角兽

2022.06 - 2024.02

智能营销产品经理

数据体系搭建：设计 200+ 埋点事件的 CDP 数据模型，覆盖用户从广告点击到复购的全链路行为，支撑 AB 实验日处理量 10万+。
AI 功能迭代：
- 开发“智能素材生成器”：基于 GPT-3.5 微调行业专属模型，实现广告文案生成效率提升 80%，CTR 提高 15%。
- 构建“用户流失预警系统”：通过 XGBoost+时序分析模型，提前 3天预测流失风险（准确率 89%），高价值客户留存率提升 18%。
增长策略：设计“社交裂变+AI推荐”组合玩法，单月新增用户 15万，获客成本降低 32%。

项目经验：技术深度与业务价值并重

项目1：AI 知识库问答系统（零代码平台）

技术架构：后端 LangChain+Qwen-72B 微调模型+Milvus 向量数据库；前端飞书多维表格+自定义 Prompt 模板引擎。
核心创新：
- 开发“动态知识切片”算法：根据用户提问自动拆分知识库段落，提升长尾问题召回率 46%。
- 设计“企业级权限控制”模块：支持部门级知识隔离与版本管理，已服务 50+ 中大型客户。
业务成果：某银行客服中心问题解决率从 68% 提升至 89%，人力成本节省 120万/年。

项目2：AI+医疗影像辅助诊断系统

技术突破：
- 改进 U-Net++ 网络结构，肺结节检测准确率从 89% 提升至 94%（在 LIDC-IDRI 数据集）。
- 开发“医生-模型协同标注”工具，标注效率提升 3倍，数据集质量通过三甲医院认证。
商业化路径：与华西医院合作获二类医疗器械认证；按例收费模式下，单医院年服务费 50万元+，已签约 12家三甲医院。

专业技能

技术能力（硬技能）：
- 大模型：Qwen/MoE 架构选型经验、LoRA 微调、Prompt Engineering（掌握 50+ 场景模板）。
- 工具链：LangChain 应用开发、PyTorch Lightning 分布式训练、MLOps 全流程（数据标注→模型监控）。
- 数据：SQL 复杂查询（日均处理 TB 级数据）、Tableau 看板搭建、AB 实验设计（p-value < 0.05）。
业务能力（软技能）：
- 需求分析：KANO 模型需求分级、Jobs-to-be-Done 框架应用。
- 产品设计：用户旅程地图（含 10+ 医疗/汽车行业案例）、功能优先级矩阵（RICE 模型）。
- 商业化：LTV/CAC 计算、定价策略设计（分层订阅/用量计费）、ROI 测算模板。

行业洞察与附加价值

行业资源：
- 发表《大模型在工业质检中的落地陷阱与破局之道》等 5篇行业分析，被机器之心、量子位等媒体转载。
- 担任中国人工智能产业发展联盟（AIIA）产品组专家，参与制定 2项行业标准。
开源贡献：
- 维护 GitHub 开源项目“AI-Product-Toolkit”（Star 1.2K+），包含 Prompt 模板库、数据标注工具等。
- 贡献 Hugging Face 模型库优化方案，被 Meta 采纳为官方文档案例。

下载完整简历 PDF