AI现状:基于100万亿Token的实证研究

作者:nunumick 发布时间:11 Dec 2025 分类: AI

说明:这是一份完全由 AI(豆包、Gemini、千问)生成的总结(包括配图),我只做了内容提取和对比整合工作。学习报告内容的同时也对比下主流模型及其 APP 的能力,原始报告来自 OpenRouter 平台,需完整内容可以看原文1

研究基于对 OpenRouter 平台上超过 100 万亿 token 的真实 LLM 交互数据分析,提供了一个关于大型语言模型(LLMs)实际使用情况的经验性视角。

报告分析了 2024 年底至 2025 年间大型语言模型(LLMs)的真实世界使用模式。研究发现,随着 OpenAI 的 o1 等推理模型的推出,市场从单次文本生成转向了多步骤、工具调用和推理密集型的工作流程,即“代理式推理”正在崛起。数据揭示,尽管编程任务在所有 LLM 使用中占据主导且增长最快,但创意角色扮演却在开源模型(OSS)的使用中占据超过一半的份额,表明用户需求具有复杂的多样性。此外,报告还提出了“灰姑娘玻璃鞋效应”,即最早找到模型 - 工作负载完美契合的早期用户群体(Foundational Cohorts)会表现出显著且持久的留存率,这成为衡量模型价值的关键指标。整体而言,LLM 生态系统是多元化且竞争激烈的,闭源模型和开源模型分别在高价值和高容量任务中发挥作用,并且亚洲市场的份额正在迅速扩大。

(Read more ...)

标签: llm
<<< EOF

Claude 技术解构:从 Constitutional AI 到多模态推理的工程实践

作者:nunumick 发布时间:22 Mar 2025 分类: developer

说明:本文基于 Anthropic 官方博客、学术论文及行业通用技术实践进行整理。部分实现细节未公开,文中相关代码与机制为合理推演或示意性实现,不代表官方真实架构。

引言

Claude 是由 Anthropic 开发的一系列先进大型语言模型(LLM),以其在安全性、长上下文处理和多模态理解方面的突出表现受到广泛关注。自 2023 年发布以来,Claude 系列(尤其是 Claude 3)在多个基准测试中展现出与 GPT-4 相当甚至更优的能力。本文将从训练范式、架构设计、推理优化到应用场景,系统解析其核心技术逻辑,并对关键创新点进行深度剖析。

(Read more ...)

标签: claude , llm , anthropic
<<< EOF

Beancount 记账进阶

作者:nunumick 发布时间:14 Jan 2025 分类: life

上一篇讲了把个人记账软件切换到 Beancount,这篇继续聊下一些进阶用法。

RSU & 股票记账

RSU 奖励是一种预期获益,准确说未归属的部分是一种赠予协议(承诺),只有每年确定归属的部分才能算是产生了收入,且归属时要按所得价值进行个人所得缴税(不同档位税率不同,个人所得税最高可以到 45%),最后在股票交易时还会视超出成本的增量所得收缴资本利得税(20%)。

签订RSU协议 -> 按计划归属 -> 缴税存股(成本价) -> 交易(市价) -> 缴纳所得税(市价 > 成本价)

流程如上,所以如果只计算收入和支出,并不一定需要把未归属的 RSU 部分也记录下来。把每次的股票归属看做公司以归属时市价赠予一定数量的股票(应纳税收益),而这个市价即为后续股票交易的成本价。

(Read more ...)

标签: beancount , rsu , stock , economy , house
<<< EOF

使用 Beancount 开启硬核记账之路

作者:nunumick 发布时间:04 Jan 2025 分类: life

早期记账历史

俗话说“你不理财,财不理你”,理财要从财务管理开始,如果对自己的财务状况都不清楚,理财投资也无从谈起。我个人的记账习惯始于 2010 年,正因为自己在那一年组建了小家庭,也算得上是对家庭的责任感驱使 ^_^。最初的记账需求很简单,仅仅是想记录下自己的消费,设置消费预算,不要超支。那时候的账目也简单,个人使用的是随手记 Pro 这个 APP,加上配套的卡牛账单导入也能实现多账户记账的自动化,对家庭总体的财务情况有一定了解。

随手记Pro-1

(Read more ...)

标签: beancount , fava , economy , python
<<< EOF

基于 Jellyfin 搭建家庭影视平台

作者:nunumick 发布时间:21 Dec 2024 分类: life

Why Jellyfin?

至于为什么使用 Jellyfin,于我而言最主要的因素就是开源和免费吧。在此之前我也进行了多方面的比较,用过 Plex 和 Emby 这两款付费软件,产品力确实在很多方面要吊打 Jellyfin,不过综合考虑如下:

  • 要获得完整体验就最好成为付费用户,那我想有这个钱我为啥不去购买爱奇艺会员?
  • 我还是想尽量基于自己的 NAS 服务器搭建一套所有权 100% 属于自己的本地化的多媒体系统
  • 实测我的 NAS 性能比较拉(J4025),无法完全享用 Plex 付费的硬件加速功能,所以选择什么方案还是应该因人而异
  • 我觉得多折腾可以让人学到一些奇奇怪怪的知识并得到实践,结果不重要,重要的是过程

Jellyfin 可以满足个人使用的绝大多数需求,有比较完善的账号管理、媒体库管理、插件体系、移动客户端、TV客户端,可以搭配的媒体软件也比较多,有 Kodi add-on,可以把 Jellyfin 仅作为媒体资源管理和推流软件,再选择其他更好用的客户端实现媒体播放。

(Read more ...)

标签: jellyfin , kodi , vidhub , sonarr , radarr
<<< EOF