點贊(0)

點贊(0)

2025年投資回顧以及2026年投資展望-大模型1

靜水深漩

2026-02-16 23:00 1234 0 0

如何守住自身的核心競爭力不被技術顛覆，又能借力人工智能打造超越市場的競爭力，實現持續(xù)超額增長是我過去一年在反復思考的問題。

作者：守望者34

來源：靜水深漩（ID：zealsaint111）

此前基于行業(yè)周期與國家政策趨勢的研判，我提前對科技賽道進行了重點布局，也因此在2024-2025年連續(xù)兩年收獲了連續(xù)跑贏市場的投資收益。站在2026年年初，面對當下瞬息萬變的復雜世界，未來一年的投資方向亟待重新梳理與聚焦。

過去一年人工智能的發(fā)展讓我很是焦慮，人工智能新技術迭代速度不僅遠超人類過往發(fā)展節(jié)奏，更在以驚人的加速度向前推進，持續(xù)追蹤這份技術變革的過程中，讓我深感疲憊與焦慮。如何守住自身的核心競爭力不被技術顛覆，又能借力人工智能打造超越市場的競爭力，實現持續(xù)超額增長是我過去一年在反復思考的問題。

基于這份思考與探索，我展開了本次的年終回顧與年初展望。本期為第一期，核心內容是對大模型進行回顧和分析。

一、大模型發(fā)展階段

（一）發(fā)展階段總覽

自2022年10月，Chat GPT3.5火爆全網后，大模型的發(fā)展呈現出四個相互疊加、螺旋上升的階段。

對話階段：我將2022-2023年這個區(qū)間分類為對話階段，該階段主要特點是奠定了大模型的基礎交互能力。

增強階段：我將2023-2024年這個區(qū)間分類為增強階段，即多模態(tài)、長上下文、部分工具的使用開始。

推理階段：我將2024-2025年這個區(qū)間分類為推理階段，即思維鏈、強化學習Scaling Law這類主流方法大放異彩。

Agent階段：從2025年年初到現在我認為是Agent走向臺前的階段，主要特點是人工智能可以自主執(zhí)行、任務可以自動化執(zhí)行等。

（二）對話階段

1、標志性事件時間線

2022年開始的人工智能對話開啟了人機交互的新紀元，可能有人會說更早的時間就已經接觸到了GPT，但這里我定義的時間線為一項技術/產品走向大多數人的時間。

2022-2023年標志性的技術或產品時間線如下：

時間	事件	公司/機構	核心意義
2022.11.30	ChatGPT發(fā)布	OpenAI	首次將大模型對話能力推向大眾，5天用戶破百萬
2023.02.01	ChatGPT Plus發(fā)布	OpenAI	商業(yè)化探索開始，$20/月訂閱模式
2023.03.14	GPT-4發(fā)布	OpenAI	多模態(tài)能力突破，約1-1.8萬億參數
2023.03.14	Claude發(fā)布	Anthropic	安全對齊理念落地，提供替代選擇
2023.03.21	Google Bard發(fā)布	Google	搜索巨頭入局，后更名為Gemini
2023.07	Claude 2發(fā)布	Anthropic	100K上下文窗口，企業(yè)級應用
2023.11	GPT-4 Turbo發(fā)布	OpenAI	128K上下文，知識更新至2023年4月

2、核心技術革新

2022-2023年，核心突破體現在架構和上下文窗口拓展方面。

架構突破：GPT-4參數達到了1-1.8萬億（預估）；MMLU得分86.4%，GPT-3這一項得分為43.9%；GSM8K數學推理得分92.0%，GPT-3這一項得分為10.4%。

上下文拓展：GPT-4 Turbo達到了128k tokens，開啟了模型可以處理更復雜需求的能力。

3、解決的核心問題梳理

這一階段大模型的發(fā)展，行業(yè)探索出了人工智能與人配合的基礎方案，回顧這一階段，我們更多的是把大模型當做一個對話工具使用，因為其幻覺問題將其當做搜索或問答工具的人不多。

問題	解決方案	影響
人機交互門檻高	自然語言對話界面	普通用戶可直接使用AI
知識獲取效率低	即時問答+多輪對話	替代傳統(tǒng)搜索引擎場景
內容創(chuàng)作成本高	文本生成+代碼編寫	文案、編程效率提升10倍+
模型安全性不足	RLHF人類反饋強化學習	減少有害輸出

（三）推理階段

1、推理階段時間線

交互階段大多數情況下只是一個有趣的聊天工具，而推理功能的出現將人工智能與解決問題開始聯系到了一起。

2024-2025年期間，大模型經歷了推理功能出現到不斷強化的過程。

時間	事件	公司/機構	核心突破
2024.09.12	o1模型發(fā)布	OpenAI	首個推理專用模型，思維鏈技術
2024.12	o3/o3-mini發(fā)布	OpenAI	推理能力大幅提升
2025.01.20	DeepSeek-R1發(fā)布	DeepSeek	開源推理模型，MIT許可證
2025.01.31	o3-mini正式發(fā)布	OpenAI	首次向免費用戶提供推理模型
2025.04.16	o3/o4-mini發(fā)布	OpenAI	快速、高效推理
2025.06.10	o3-pro發(fā)布	OpenAI	最高可靠性推理模型

2、核心技術革新

該階段的核心創(chuàng)新為基于Scaling Law的強化學習，該技術支持了多項技術的應用和拓展。

思維鏈技術：思維鏈技術的出現使得大模型在回答問題前能進行多步推理，提升模型處理問題的能力；為了加強推理能力，強化學習得以定向應用。

標志性模型：2025年1月，DS發(fā)布了-R1模型引爆了國內大模型應用的熱潮。R1模型幾個核心特點，完全開源，訓練成本僅為o1的很小比例，671B參數。

3、解決的核心問題

這一階段大模型通過思維鏈、強化學習等基礎技能的革新，使得大模型可以開始承擔相對復雜的工作。

印象中我大約是在25年一季度末，二季度初開始使用人工智能輔助分析工作。到了三季度時候，大量的分析工作開始使用人工智能。當時間線到了四季度和26年1月的時候，思維邏輯的驗證也開始使用人工智能。

問題	解決方案	影響
復雜推理能力不足	思維鏈+強化學習	數學、編程、科學問題解決能力質變
模型"幻覺"問題	多步驗證推理	事實準確性顯著提升
推理成本高昂	蒸餾小模型	邊緣設備可部署
閉源模型壟斷	DeepSeek開源	降低行業(yè)門檻，促進創(chuàng)新

（四）Agent階段

1、Agent發(fā)展時間線

2025年第一次聽Agent的時候，讓我又震驚又期待，突然發(fā)現我的很多想法因為“手殘”問題（不會編程）無法實現，而Agent讓我看到了希望。

最近比較火的Agent集群按照我的理解就是多Agent并行，多Agent執(zhí)行下，不同的Agent代表了不同的角色，例如有的負責提出思路，有的負責審視，有的負責提出反對意見等等，通過這樣一個多Agent“爭吵”、協同的模式解決復雜問題，并提升精準度。

時間	事件	公司/機構	核心能力
2023.03.30	AutoGPT發(fā)布	開源社區(qū)	首個自主AI Agent實驗
2023.11	Custom GPTs發(fā)布	OpenAI	用戶可創(chuàng)建專用Agent
2024.03	Devin 1.0發(fā)布	Cognition	首個AI軟件工程師
2024.06	Claude 3.5 Sonnet	Anthropic	Computer Use能力
2024.11	MCP協議發(fā)布	Anthropic	標準化AI工具接口
2025.01.23	Operator發(fā)布	OpenAI	瀏覽器自動化Agent
2025.02	Claude Code發(fā)布	Anthropic	編程Agent工具
2025.04	Devin 2.0發(fā)布	Cognition	多Agent并行，降價至$20/月

2、核心技術更新

整體看我認為Agent是通向全面AGI的過程，在過去的發(fā)展中，我們看到Agent擁有了感知能力，這一點區(qū)別于大語言模型的基礎能力。例如，Agent可以感知我們的屏幕，基于我們的屏幕和任務需求再進行推理，這樣就實現了對工具的調用。

在這2年中，我們看到了Claude Computer Use通過技術的革新可以實現像人類一樣使用計算機，能進行網頁搜索、填寫表格、操作軟件等等。

3、解決的核心問題

Agent會有一篇專門梳理，此處作為簡單的功能梳理。

這兩天通過扣子搭建了屬于自己的投資類Agent，頓時感覺擁有了自己的“軍團”。

問題	解決方案	影響
AI只能對話不能執(zhí)行	計算機使用能力	自動化網頁操作、軟件使用
編程效率瓶頸	AI軟件工程師	端到端軟件開發(fā)自動化
工具集成復雜	MCP標準化協議	統(tǒng)一AI與外部系統(tǒng)接口
單任務限制	多Agent并行	復雜項目協同處理

（四）文生圖/視頻階段

1、標志性事件時間線

文生圖/視頻是最有意思的一個領域，一開始我覺得這個領域主要是為了解決圖片和視頻創(chuàng)作問題，伴隨了解的深入才意識到這里核心是讓人工智能懂得世界運行的法則，例如物理法則。一旦人工智能理解了法則，那么人工智能將實現AGI。

過去幾年標志性事件梳理如下：

時間	事件	公司/機構	核心突破
2022.04	DALL-E 2發(fā)布	OpenAI	高質量圖像生成
2022.07	Midjourney v3發(fā)布	Midjourney	藝術風格圖像
2022.08	Stable Diffusion發(fā)布	Stability AI	開源圖像生成
2023.10	DALL-E 3發(fā)布	OpenAI	與ChatGPT集成
2024.02	Sora發(fā)布	OpenAI	文本生成視頻，60秒[^52^][^53^]
2024.02	Stable Diffusion 3發(fā)布	Stability AI	開源模型升級[^21^]
2024.08	DALL-E 3免費版	OpenAI	每日2張免費生成[^21^]
2024.12	Sora公開可用	OpenAI	ChatGPT訂閱用戶可用[^21^]
2025.03	GPT-4o圖像生成	OpenAI	原生多模態(tài)圖像生成[^21^]
2025.05	Google Veo 3發(fā)布	Google	高質量視頻生成[^21^]

2、核心技術革新

過去幾年技術迭代體現在更高的畫質，更好的物理法則理解能力，更長的連續(xù)視頻時間等方向。

以Sora的技術特點為例，采用擴散模型+Transformer架構，通過該方式實現了60秒連續(xù)視頻生成、多種畫面比例（寬屏/豎屏/方形）、視頻擴展和編輯能力。

這兩天字節(jié)發(fā)布的SeeDance 2.0再次引起了市場的熱潮。我使用這個工具做了一個10秒的視頻，從結果看，畫面清晰、邏輯合理，理解物理法則（例如拳頭碰撞產生的回彈等細節(jié)處理）。

3、能解決的核心問題

從當前看解決了圖像內容生成，視頻內容生成復雜的問題，可以被應用于廣告制作、影視制作、游戲制作等等，但從中期看，是機器人、更好的研發(fā)工具的基礎技術。

問題	解決方案	影響	問題
視覺內容創(chuàng)作門檻高	文本到圖像/視頻	設計師、創(chuàng)作者效率提升	視覺內容創(chuàng)作門檻高
創(chuàng)意表達受限	AI輔助創(chuàng)意生成	降低專業(yè)軟件學習成本	創(chuàng)意表達受限
視頻制作成本高	AI視頻生成	小規(guī)模團隊可制作專業(yè)視頻	視頻制作成本高

（五）不同模型技術之間關系

從前面的梳理我們可以看到，模型技術的迭代是一個漸進的過程，并且在不斷加速，同時我們也看到不同技術之前呈現了能力疊加演進的特點。

模型能力的迭代中每個新階段都建立在之前階段的能力之上，類似點亮技能樹。文生圖/視頻能力與各階段并行發(fā)展，并且在2025年后，各個階段能力開始融合，于是我們看到了GPT-5統(tǒng)一對話+推理模式。

試想一下，2024年的時候我們?yōu)榱送瓿梢粋€工作需要頻繁的切換人工智能工具，而現在可以在部分環(huán)境下使用同一個工具完成，預計未來，伴隨模型技術的進一步融合，一個對話框完成所有需求將成為主流發(fā)展方向。

二、2025-2026年主要技術革新

通過前面對2022-2026年的回放，我粗略對大模型的過去進行了梳理，總結了五個主要趨勢。

趨勢	描述	代表產品
推理能力普及化	從專業(yè)模型走向通用集成	GPT-5統(tǒng)一架構、Qwen3混合模式
Agent能力實用化	從實驗走向生產環(huán)境	Operator、Devin、Claude Code
開源模型高端化	開源性能逼近閉源	DeepSeek-R1、Llama 4、Qwen3
多模態(tài)原生融合	統(tǒng)一架構處理多種模態(tài)	GPT-4o、Gemini 2.0/3.0
長上下文競賽	百萬級上下文成為標配	Llama 4 Scout(10M)、Gemini 2.5 Pro(2M)

（一）重大技術革新

2025年是奇幻的一年，可能未來回身看的時候會被定義為人類科技開始進入奇點的元年，幾個重要的特征包含：

推理能力普及：o3系列、DeepSeek-R1推動推理模型大眾化。

Agent元年：：Operator、Devin、Claude Code等產品標志著AI從"會說"到"會做"。

開源的時代：Llama 4、Qwen 3、DeepSeek等開源模型性能逼近閉源模型。

統(tǒng)一架構趨勢：GPT-5整合對話與推理能力，混合專家模型(MoE)成為主流

（二）主要技術革新列示

1、基礎模型類

時間	公司/機構	模型名稱	類型	核心參數/特點
2025.01.20	DeepSeek	DeepSeek-R1	推理模型	671B參數，MIT開源，性能對標o1，蒸餾版1.5B-70B
2025.01.28	Alibaba	Qwen2.5-Max	MoE基礎模型	超20萬億tokens預訓練，性能優(yōu)于DeepSeek-V3
2025.03.27	Alibaba	Qwen2.5-Omni-7B	多模態(tài)模型	7B參數，端到端多模態(tài)，支持文本/圖像/音頻/視頻
2025.04.29	Alibaba	Qwen3系列	混合推理模型	6個Dense模型(0.6B-32B)+2個MoE模型(30B/235B)，119種語言
2025.05	Anthropic	Claude Opus 4 / Sonnet 4	基礎模型	編碼、推理、Agent能力大幅提升，ASL3安全級別
2025.08.07	OpenAI	GPT-5	統(tǒng)一基礎模型	~3-10萬億參數(估算)，融合GPT+o系列推理能力，智能路由系統(tǒng)
2025.08	OpenAI	GPT-5.2	基礎模型升級	GPT-5迭代版本，性能優(yōu)化
2025.11	OpenAI	GPT-5.1	基礎模型	生態(tài)集成增強，插件支持

2、推理模型類

時間	公司/機構	模型名稱	類型	核心參數/特點
2025.01.31	OpenAI	o3-mini	輕量推理模型	首次向免費用戶開放，快速推理
2025.04.16	OpenAI	o3 / o4-mini	推理模型	快速、成本高效，強AIME性能
2025.05.28	DeepSeek	DeepSeek-R1-0528	推理模型更新	R1升級版，推理能力增強
2025.06.10	OpenAI	o3-pro	專業(yè)推理模型	ChatGPT Pro/API可用，最高可靠性
2025.08.21	DeepSeek	DeepSeek V3.1	基礎+推理	新版本升級
2026.02(預計)	DeepSeek	DeepSeek V4	推理模型	Engram記憶架構，100萬+上下文，代碼生成超越Claude/GPT

3、多模態(tài)模型類

時間	公司/機構	模型名稱	類型	核心參數/特點
2025.03.27	Alibaba	Qwen2.5-Omni-7B	多模態(tài)	7B參數，全模態(tài)理解
2025.03	OpenAI	GPT-4o圖像生成	圖像生成	原生多模態(tài)圖像生成
2025.05	Google	Veo 3	視頻生成	高質量AI視頻生成
2025.07.22	Alibaba	Qwen3-Coder-480B-A35B	代碼多模態(tài)	480B總參數/35B激活，256K上下文(可擴展至1M)，7.5T代碼數據
2025.08.04	Alibaba	Qwen-Image	圖像生成	20B參數，MMDiT架構，原生文本渲染
2025.08.19	Alibaba	Qwen-Image-Edit	圖像編輯	語義控制+外觀保持
2025.11	Google	Gemini 3 Pro	多模態(tài)	代碼生成速度領先，大規(guī)模上下文，屏幕/視頻理解

4、垂類模型類

時間	公司/機構	模型名稱	類型	核心參數/特點
2025.01.23	OpenAI	Operator	AI Agent	CUA模型，瀏覽器自動化，87%標準任務成功率
2025.02	OpenAI	Deep Research	研究Agent	o3模型支持，5-30分鐘生成專業(yè)報告
2025.02	Anthropic	Claude Code	編程Agent	首個Agentic編碼工具，研究預覽版
2025.04	Cognition	Devin 2.0	軟件工程Agent	MultiDevin并行，云IDE，$20/月定價
2025.04	Anthropic	Research + Google Workspace	研究Agent	跨內部工作上下文和網絡搜索
2025.05	Anthropic	Web Search API	Agent工具	為Claude添加實時網絡搜索能力
2025.07.24	Alibaba	Qwen-MT	翻譯專用	92種官方語言支持
2025.09.23	Alibaba	Qwen3Guard	安全模型	實時風險檢測，多語言支持
2025.09.29	Anthropic	Claude Sonnet 4.5	編程Agent	SWE-bench Verified 77.2%(82%并行測試)，30小時+持續(xù)專注
2025.11.24	Anthropic	Claude Opus 4.5	編程Agent	SWE-bench Verified 80.9%，降價67%
2026.01	Anthropic	Cowork	Agent GUI	Claude Code圖形界面版，面向非技術用戶

（三）奇幻的一年

2025年是極具奇幻色彩的一年，人工智能在這一年里實現了跨越式進化——從最初輔助我分析行業(yè)、研究市場，逐步深入到拆解我的邏輯思維漏洞、精準補全短板，最終形成能協助我高效推進工作的智能體集群。回望這一過程，其難度不斷提升、進化速度持續(xù)加快。結合前文對人工智能主流技術及技術間關聯的拆解分析，我更加堅定一個判斷：我們正處在人類文明加速發(fā)展的前期，甚至可能已正式步入這一加速周期。對于投資而言，若能明確當前屬于文明加速期、而非互聯網泡沫時代的特征，那么堅定擁抱人工智能領域的投資機會，便是必然選擇。后續(xù)篇章中，我將進一步拆解、分析、聚焦相關內容，不斷思考人工智能的發(fā)展邏輯與投資價值。

注：文章為作者獨立觀點，不代表資產界立場。

題圖來自 Pexels，基于 CC0 協議

本文由“靜水深漩”投稿資產界，并經資產界編輯發(fā)布。版權歸原作者所有，未經授權，請勿轉載，謝謝！

原標題： 2025年投資回顧以及2026年投資展望-大模型1