西政資本--西政地產、金融圈校友傾心打造的地產、資本運作平臺,為您提供最全面、最專業的地產、金融知識及實操干貨!微信公眾號ID:xizheng_ziben
作者:守望者34
來源:靜水深漩(ID:zealsaint111)
此前基于行業周期與國家政策趨勢的研判,我提前對科技賽道進行了重點布局,也因此在2024-2025年連續兩年收獲了連續跑贏市場的投資收益。站在2026年年初,面對當下瞬息萬變的復雜世界,未來一年的投資方向亟待重新梳理與聚焦。
過去一年人工智能的發展讓我很是焦慮,人工智能新技術迭代速度不僅遠超人類過往發展節奏,更在以驚人的加速度向前推進,持續追蹤這份技術變革的過程中,讓我深感疲憊與焦慮。如何守住自身的核心競爭力不被技術顛覆,又能借力人工智能打造超越市場的競爭力,實現持續超額增長是我過去一年在反復思考的問題。
基于這份思考與探索,我展開了本次的年終回顧與年初展望。本期為第一期,核心內容是對大模型進行回顧和分析。
一、大模型發展階段
(一)發展階段總覽
自2022年10月,Chat GPT3.5火爆全網后,大模型的發展呈現出四個相互疊加、螺旋上升的階段。

對話階段:我將2022-2023年這個區間分類為對話階段,該階段主要特點是奠定了大模型的基礎交互能力。
增強階段:我將2023-2024年這個區間分類為增強階段,即多模態、長上下文、部分工具的使用開始。
推理階段:我將2024-2025年這個區間分類為推理階段,即思維鏈、強化學習Scaling Law這類主流方法大放異彩。
Agent階段:從2025年年初到現在我認為是Agent走向臺前的階段,主要特點是人工智能可以自主執行、任務可以自動化執行等。
(二)對話階段
1、標志性事件時間線
2022年開始的人工智能對話開啟了人機交互的新紀元,可能有人會說更早的時間就已經接觸到了GPT,但這里我定義的時間線為一項技術/產品走向大多數人的時間。
2022-2023年標志性的技術或產品時間線如下:
時間 | 事件 | 公司/機構 | 核心意義 |
2022.11.30 | ChatGPT發布 | OpenAI | 首次將大模型對話能力推向大眾,5天用戶破百萬 |
2023.02.01 | ChatGPT Plus發布 | OpenAI | 商業化探索開始,$20/月訂閱模式 |
2023.03.14 | GPT-4發布 | OpenAI | 多模態能力突破,約1-1.8萬億參數 |
2023.03.14 | Claude發布 | Anthropic | 安全對齊理念落地,提供替代選擇 |
2023.03.21 | Google Bard發布 | 搜索巨頭入局,后更名為Gemini | |
2023.07 | Claude 2發布 | Anthropic | 100K上下文窗口,企業級應用 |
2023.11 | GPT-4 Turbo發布 | OpenAI | 128K上下文,知識更新至2023年4月 |
2、核心技術革新
2022-2023年,核心突破體現在架構和上下文窗口拓展方面。
架構突破:GPT-4參數達到了1-1.8萬億(預估);MMLU得分86.4%,GPT-3這一項得分為43.9%;GSM8K數學推理得分92.0%,GPT-3這一項得分為10.4%。
上下文拓展:GPT-4 Turbo達到了128k tokens,開啟了模型可以處理更復雜需求的能力。
3、解決的核心問題梳理
這一階段大模型的發展,行業探索出了人工智能與人配合的基礎方案,回顧這一階段,我們更多的是把大模型當做一個對話工具使用,因為其幻覺問題將其當做搜索或問答工具的人不多。
問題 | 解決方案 | 影響 |
人機交互門檻高 | 自然語言對話界面 | 普通用戶可直接使用AI |
知識獲取效率低 | 即時問答+多輪對話 | 替代傳統搜索引擎場景 |
內容創作成本高 | 文本生成+代碼編寫 | 文案、編程效率提升10倍+ |
模型安全性不足 | RLHF人類反饋強化學習 | 減少有害輸出 |
(三)推理階段
1、推理階段時間線
交互階段大多數情況下只是一個有趣的聊天工具,而推理功能的出現將人工智能與解決問題開始聯系到了一起。
2024-2025年期間,大模型經歷了推理功能出現到不斷強化的過程。
時間 | 事件 | 公司/機構 | 核心突破 |
2024.09.12 | o1模型發布 | OpenAI | 首個推理專用模型,思維鏈技術 |
2024.12 | o3/o3-mini發布 | OpenAI | 推理能力大幅提升 |
2025.01.20 | DeepSeek-R1發布 | DeepSeek | 開源推理模型,MIT許可證 |
2025.01.31 | o3-mini正式發布 | OpenAI | 首次向免費用戶提供推理模型 |
2025.04.16 | o3/o4-mini發布 | OpenAI | 快速、高效推理 |
2025.06.10 | o3-pro發布 | OpenAI | 最高可靠性推理模型 |
2、核心技術革新
該階段的核心創新為基于Scaling Law的強化學習,該技術支持了多項技術的應用和拓展。
思維鏈技術:思維鏈技術的出現使得大模型在回答問題前能進行多步推理,提升模型處理問題的能力;為了加強推理能力,強化學習得以定向應用。
標志性模型:2025年1月,DS發布了-R1模型引爆了國內大模型應用的熱潮。R1模型幾個核心特點,完全開源,訓練成本僅為o1的很小比例,671B參數。
3、解決的核心問題
這一階段大模型通過思維鏈、強化學習等基礎技能的革新,使得大模型可以開始承擔相對復雜的工作。
印象中我大約是在25年一季度末,二季度初開始使用人工智能輔助分析工作。到了三季度時候,大量的分析工作開始使用人工智能。當時間線到了四季度和26年1月的時候,思維邏輯的驗證也開始使用人工智能。
問題 | 解決方案 | 影響 |
復雜推理能力不足 | 思維鏈+強化學習 | 數學、編程、科學問題解決能力質變 |
模型"幻覺"問題 | 多步驗證推理 | 事實準確性顯著提升 |
推理成本高昂 | 蒸餾小模型 | 邊緣設備可部署 |
閉源模型壟斷 | DeepSeek開源 | 降低行業門檻,促進創新 |
(四)Agent階段
1、Agent發展時間線
2025年第一次聽Agent的時候,讓我又震驚又期待,突然發現我的很多想法因為“手殘”問題(不會編程)無法實現,而Agent讓我看到了希望。
最近比較火的Agent集群按照我的理解就是多Agent并行,多Agent執行下,不同的Agent代表了不同的角色,例如有的負責提出思路,有的負責審視,有的負責提出反對意見等等,通過這樣一個多Agent“爭吵”、協同的模式解決復雜問題,并提升精準度。
時間 | 事件 | 公司/機構 | 核心能力 |
2023.03.30 | AutoGPT發布 | 開源社區 | 首個自主AI Agent實驗 |
2023.11 | Custom GPTs發布 | OpenAI | 用戶可創建專用Agent |
2024.03 | Devin 1.0發布 | Cognition | 首個AI軟件工程師 |
2024.06 | Claude 3.5 Sonnet | Anthropic | Computer Use能力 |
2024.11 | MCP協議發布 | Anthropic | 標準化AI工具接口 |
2025.01.23 | Operator發布 | OpenAI | 瀏覽器自動化Agent |
2025.02 | Claude Code發布 | Anthropic | 編程Agent工具 |
2025.04 | Devin 2.0發布 | Cognition | 多Agent并行,降價至$20/月 |
2、核心技術更新
整體看我認為Agent是通向全面AGI的過程,在過去的發展中,我們看到Agent擁有了感知能力,這一點區別于大語言模型的基礎能力。例如,Agent可以感知我們的屏幕,基于我們的屏幕和任務需求再進行推理,這樣就實現了對工具的調用。
在這2年中,我們看到了Claude Computer Use通過技術的革新可以實現像人類一樣使用計算機,能進行網頁搜索、填寫表格、操作軟件等等。
3、解決的核心問題
Agent會有一篇專門梳理,此處作為簡單的功能梳理。
這兩天通過扣子搭建了屬于自己的投資類Agent,頓時感覺擁有了自己的“軍團”。
問題 | 解決方案 | 影響 |
AI只能對話不能執行 | 計算機使用能力 | 自動化網頁操作、軟件使用 |
編程效率瓶頸 | AI軟件工程師 | 端到端軟件開發自動化 |
工具集成復雜 | MCP標準化協議 | 統一AI與外部系統接口 |
單任務限制 | 多Agent并行 | 復雜項目協同處理 |
(四)文生圖/視頻階段
1、標志性事件時間線
文生圖/視頻是最有意思的一個領域,一開始我覺得這個領域主要是為了解決圖片和視頻創作問題,伴隨了解的深入才意識到這里核心是讓人工智能懂得世界運行的法則,例如物理法則。一旦人工智能理解了法則,那么人工智能將實現AGI。
過去幾年標志性事件梳理如下:
時間 | 事件 | 公司/機構 | 核心突破 |
2022.04 | DALL-E 2發布 | OpenAI | 高質量圖像生成 |
2022.07 | Midjourney v3發布 | Midjourney | 藝術風格圖像 |
2022.08 | Stable Diffusion發布 | Stability AI | 開源圖像生成 |
2023.10 | DALL-E 3發布 | OpenAI | 與ChatGPT集成 |
2024.02 | Sora發布 | OpenAI | 文本生成視頻,60秒[^52^][^53^] |
2024.02 | Stable Diffusion 3發布 | Stability AI | 開源模型升級[^21^] |
2024.08 | DALL-E 3免費版 | OpenAI | 每日2張免費生成[^21^] |
2024.12 | Sora公開可用 | OpenAI | ChatGPT訂閱用戶可用[^21^] |
2025.03 | GPT-4o圖像生成 | OpenAI | 原生多模態圖像生成[^21^] |
2025.05 | Google Veo 3發布 | 高質量視頻生成[^21^] |
2、核心技術革新
過去幾年技術迭代體現在更高的畫質,更好的物理法則理解能力,更長的連續視頻時間等方向。
以Sora的技術特點為例,采用擴散模型+Transformer架構,通過該方式實現了60秒連續視頻生成、多種畫面比例(寬屏/豎屏/方形)、視頻擴展和編輯能力。
這兩天字節發布的SeeDance 2.0再次引起了市場的熱潮。我使用這個工具做了一個10秒的視頻,從結果看,畫面清晰、邏輯合理,理解物理法則(例如拳頭碰撞產生的回彈等細節處理)。
3、能解決的核心問題
從當前看解決了圖像內容生成,視頻內容生成復雜的問題,可以被應用于廣告制作、影視制作、游戲制作等等,但從中期看,是機器人、更好的研發工具的基礎技術。
問題 | 解決方案 | 影響 | 問題 |
視覺內容創作門檻高 | 文本到圖像/視頻 | 設計師、創作者效率提升 | 視覺內容創作門檻高 |
創意表達受限 | AI輔助創意生成 | 降低專業軟件學習成本 | 創意表達受限 |
視頻制作成本高 | AI視頻生成 | 小規模團隊可制作專業視頻 | 視頻制作成本高 |
(五)不同模型技術之間關系
從前面的梳理我們可以看到,模型技術的迭代是一個漸進的過程,并且在不斷加速,同時我們也看到不同技術之前呈現了能力疊加演進的特點。
模型能力的迭代中每個新階段都建立在之前階段的能力之上,類似點亮技能樹。文生圖/視頻能力與各階段并行發展,并且在2025年后,各個階段能力開始融合,于是我們看到了GPT-5統一對話+推理模式。
試想一下,2024年的時候我們為了完成一個工作需要頻繁的切換人工智能工具,而現在可以在部分環境下使用同一個工具完成,預計未來,伴隨模型技術的進一步融合,一個對話框完成所有需求將成為主流發展方向。

二、2025-2026年主要技術革新
通過前面對2022-2026年的回放,我粗略對大模型的過去進行了梳理,總結了五個主要趨勢。
趨勢 | 描述 | 代表產品 |
推理能力普及化 | 從專業模型走向通用集成 | GPT-5統一架構、Qwen3混合模式 |
Agent能力實用化 | 從實驗走向生產環境 | Operator、Devin、Claude Code |
開源模型高端化 | 開源性能逼近閉源 | DeepSeek-R1、Llama 4、Qwen3 |
多模態原生融合 | 統一架構處理多種模態 | GPT-4o、Gemini 2.0/3.0 |
長上下文競賽 | 百萬級上下文成為標配 | Llama 4 Scout(10M)、Gemini 2.5 Pro(2M) |
(一)重大技術革新
2025年是奇幻的一年,可能未來回身看的時候會被定義為人類科技開始進入奇點的元年,幾個重要的特征包含:
推理能力普及:o3系列、DeepSeek-R1推動推理模型大眾化。
Agent元年::Operator、Devin、Claude Code等產品標志著AI從"會說"到"會做"。
開源的時代:Llama 4、Qwen 3、DeepSeek等開源模型性能逼近閉源模型。
統一架構趨勢:GPT-5整合對話與推理能力,混合專家模型(MoE)成為主流
(二)主要技術革新列示
1、基礎模型類
時間 | 公司/機構 | 模型名稱 | 類型 | 核心參數/特點 |
2025.01.20 | DeepSeek | DeepSeek-R1 | 推理模型 | 671B參數,MIT開源,性能對標o1,蒸餾版1.5B-70B |
2025.01.28 | Alibaba | Qwen2.5-Max | MoE基礎模型 | 超20萬億tokens預訓練,性能優于DeepSeek-V3 |
2025.03.27 | Alibaba | Qwen2.5-Omni-7B | 多模態模型 | 7B參數,端到端多模態,支持文本/圖像/音頻/視頻 |
2025.04.29 | Alibaba | Qwen3系列 | 混合推理模型 | 6個Dense模型(0.6B-32B)+2個MoE模型(30B/235B),119種語言 |
2025.05 | Anthropic | Claude Opus 4 / Sonnet 4 | 基礎模型 | 編碼、推理、Agent能力大幅提升,ASL3安全級別 |
2025.08.07 | OpenAI | GPT-5 | 統一基礎模型 | ~3-10萬億參數(估算),融合GPT+o系列推理能力,智能路由系統 |
2025.08 | OpenAI | GPT-5.2 | 基礎模型升級 | GPT-5迭代版本,性能優化 |
2025.11 | OpenAI | GPT-5.1 | 基礎模型 | 生態集成增強,插件支持 |
2、推理模型類
時間 | 公司/機構 | 模型名稱 | 類型 | 核心參數/特點 |
2025.01.31 | OpenAI | o3-mini | 輕量推理模型 | 首次向免費用戶開放,快速推理 |
2025.04.16 | OpenAI | o3 / o4-mini | 推理模型 | 快速、成本高效,強AIME性能 |
2025.05.28 | DeepSeek | DeepSeek-R1-0528 | 推理模型更新 | R1升級版,推理能力增強 |
2025.06.10 | OpenAI | o3-pro | 專業推理模型 | ChatGPT Pro/API可用,最高可靠性 |
2025.08.21 | DeepSeek | DeepSeek V3.1 | 基礎+推理 | 新版本升級 |
2026.02(預計) | DeepSeek | DeepSeek V4 | 推理模型 | Engram記憶架構,100萬+上下文,代碼生成超越Claude/GPT |
3、多模態模型類
時間 | 公司/機構 | 模型名稱 | 類型 | 核心參數/特點 |
2025.03.27 | Alibaba | Qwen2.5-Omni-7B | 多模態 | 7B參數,全模態理解 |
2025.03 | OpenAI | GPT-4o圖像生成 | 圖像生成 | 原生多模態圖像生成 |
2025.05 | Veo 3 | 視頻生成 | 高質量AI視頻生成 | |
2025.07.22 | Alibaba | Qwen3-Coder-480B-A35B | 代碼多模態 | 480B總參數/35B激活,256K上下文(可擴展至1M),7.5T代碼數據 |
2025.08.04 | Alibaba | Qwen-Image | 圖像生成 | 20B參數,MMDiT架構,原生文本渲染 |
2025.08.19 | Alibaba | Qwen-Image-Edit | 圖像編輯 | 語義控制+外觀保持 |
2025.11 | Gemini 3 Pro | 多模態 | 代碼生成速度領先,大規模上下文,屏幕/視頻理解 |
4、垂類模型類
時間 | 公司/機構 | 模型名稱 | 類型 | 核心參數/特點 |
2025.01.23 | OpenAI | Operator | AI Agent | CUA模型,瀏覽器自動化,87%標準任務成功率 |
2025.02 | OpenAI | Deep Research | 研究Agent | o3模型支持,5-30分鐘生成專業報告 |
2025.02 | Anthropic | Claude Code | 編程Agent | 首個Agentic編碼工具,研究預覽版 |
2025.04 | Cognition | Devin 2.0 | 軟件工程Agent | MultiDevin并行,云IDE,$20/月定價 |
2025.04 | Anthropic | Research + Google Workspace | 研究Agent | 跨內部工作上下文和網絡搜索 |
2025.05 | Anthropic | Web Search API | Agent工具 | 為Claude添加實時網絡搜索能力 |
2025.07.24 | Alibaba | Qwen-MT | 翻譯專用 | 92種官方語言支持 |
2025.09.23 | Alibaba | Qwen3Guard | 安全模型 | 實時風險檢測,多語言支持 |
2025.09.29 | Anthropic | Claude Sonnet 4.5 | 編程Agent | SWE-bench Verified 77.2%(82%并行測試),30小時+持續專注 |
2025.11.24 | Anthropic | Claude Opus 4.5 | 編程Agent | SWE-bench Verified 80.9%,降價67% |
2026.01 | Anthropic | Cowork | Agent GUI | Claude Code圖形界面版,面向非技術用戶 |
(三)奇幻的一年
2025年是極具奇幻色彩的一年,人工智能在這一年里實現了跨越式進化——從最初輔助我分析行業、研究市場,逐步深入到拆解我的邏輯思維漏洞、精準補全短板,最終形成能協助我高效推進工作的智能體集群。回望這一過程,其難度不斷提升、進化速度持續加快。結合前文對人工智能主流技術及技術間關聯的拆解分析,我更加堅定一個判斷:我們正處在人類文明加速發展的前期,甚至可能已正式步入這一加速周期。對于投資而言,若能明確當前屬于文明加速期、而非互聯網泡沫時代的特征,那么堅定擁抱人工智能領域的投資機會,便是必然選擇。后續篇章中,我將進一步拆解、分析、聚焦相關內容,不斷思考人工智能的發展邏輯與投資價值。
注:文章為作者獨立觀點,不代表資產界立場。
題圖來自 Pexels,基于 CC0 協議
本文由“靜水深漩”投稿資產界,并經資產界編輯發布。版權歸原作者所有,未經授權,請勿轉載,謝謝!

靜水深漩 











