因為專業 · 所以做得更好
ChatGPT——生成式AI里程碑
相比之前的生成式對話產品,ChatGPT(Chat Generative Pre-trained Transformer )在大范圍連續對話能力、生成內 容質量、語言理解能力和邏輯推理能力上都得到大幅提升,超出了大眾對于一款聊天機器人的預期,是生成式AI(AIGC) 極為關鍵的發展節點。作為一款生成式預訓練大語言模型,“Chat”指向它的功能,“Generative”代表它屬于生成式 算法。生成式算法在過去數年中受制于RNN的內生缺陷始終發展緩慢,直到2017年 “Transformer”架構出現并解決了 傳統RNN模型的問題,生成式AI才開始在預訓練的Transformer架構之上煥發生機,NLP、CV甚至多模態領域通用基礎 大模型飛速演進。在模型參數量幾何級數增長以及多種訓練方式的探索之中,ChatGPT橫空出世,也標志著通用基礎大 模型將突破NLP領域以小模型為主導的傳統發展范式。
探秘ChatGPT的能力從何而來?
ChatGPT具有的驚人效果,是在超大預訓練語言模型GPT-3.5基礎上,進一步根據人的需求目標進行模型調優的結果。巨 大的參數量和預訓練數據量讓GPT-3.5成為一顆儲備了大量知識,并且具備語言生成能力的混沌“大腦”,再使用人類反 饋強化學習(RHLF)的方法進行指令精調,將模型的各項能力激活,并以符合人類的需求、偏好和價值觀的方式有效釋 放,同時大大提升了模型應對從未見過的新指令的能力。此外,ChatGPT在邏輯推理、上下文理解等方面的能力,是模 型參數量達到該量級后“涌現”出的,即所謂的“大力出奇跡”,這一現象在其他預訓練大模型中也得到了印證。
國內外主要大語言模型研發路徑與技術對比
與ChatGPT功能對標的大語言模型(Large Language Models, LLMs),目前國外主要有Google推出的Gopher、LaMDA 以及Meta的Llama等;國內為百度首發的“文心一言”、360發布的大語言模型、阿里發布的“通義千問”、商湯發布的 “商量”等。雖從對話和文本生成的直觀體驗看ChatGPT略勝一籌,但對于Google等國外大廠而言,克隆ChatGPT并不 存在太高壁壘,當前暫時落后主要是出于公司戰略與技術理念差異,選擇了不同技術路線,隨著各家探索成果和新技術方 法的實踐不斷推進,仍存在對GPT系列模型趕超的可能。對百度等國內大廠而言,則在數據、算力、工程化能力等關鍵要 素上存在短板,短期內難以對國外領先大模型實現趕超,為跟隨者角色,長期更需要國內AI全產業鏈整體進化。
企業商業化路徑
商業模式上,ChatGPT已經明確指向API、訂閱制和戰略合作(嵌入微軟Bing、Office等軟件)三種營收方式,且已在用 在數據積累、產品布局和生態建設層面充分領先;Google雖有意追趕,但由于聊天機器人這樣的產品形態對于其主營的 搜索引擎業務的助益有限,因此在與搜索引擎結合方面較為審慎,更希望借助大模型能力開展“模型即服務”范式,開拓 其當前市占率較低的云服務業務的市場空間。作為國內大模型的標桿企業,百度的選擇與Google更為類似,“文心千帆” 產品劍指B端市場,意圖帶動云服務營收。
中國自研通用基礎LLMs的重要意義
2023年3月中,OpenAI宣布ChatGPT整合GPT4,實現多模態交互、大幅提升復雜長文本理解與生成能力、可控性增強, 引起全球科技界震動。在國內科技及投資各領域的高度關注下,百度舉辦了“文心一言”產品發布會,雖說從產品功能、 成熟度、支持用戶并發等維度距ChatGPT還有不足,但也是中國在這新一輪“科技軍備競賽”中的勇于嘗試與發聲,目前百度也已啟動API接口開放測試,瞄準B端市場。緊隨其后,360、阿里、華為、商湯、京東、科大訊飛、字節跳動等巨頭企業也動作頻頻。
從自研通用預訓練大語言模型的必要性角度分析:在全球政治經濟局勢下,自主可控是保障網絡安全、 信息安全的前提,自研基石模型具有高度戰略意義;從自研的可行性角度分析:基于前文討論的通用基礎LLMs研發所需 的算力、數據、算法、人才、資金儲備等,中國僅有少數頭部互聯網企業具備研發“入場券”。宣布入局的頭部企業基于 自身業務生態選擇的戰略路線也不盡相同。但可以大膽假設,未來若形成大模型能力領先,誰擁有通用基礎大模型與生態 和流量入口,誰就更有可能擁有從應用層到算力層的營收話語權。
數字產業chatgpt應用開發方向
1)變革人機交互方式:既有軟件將接入對話能力,交互界面發生變革,自然語言成為用戶發布操作指令的新模態。這一 影響將從搜索引擎等知識信息平臺拓展到一切人機交互型應用。友好度和功能性的顯著提升將激活軟件服務的增量用戶市場;
2)豐富產品種類:將誕生新一批AI-first的應用,如創意設計、AI營銷、AI運營等領域;
3)塑造新興商業模式:AI 主導的“模型即服務”商業邏輯將重構應用開發流程,傳統企業可享受低成本構建應用模型的便利;
4)構建新興生態平 臺:超級應用的出現,本質上搭建了用戶需求與各類信息服務之間的基于自然語言交互的平臺生態,塑造了移動互聯網后 新的流量入口。
AI應用熱潮與應用革命
ChatGPT被稱為AI的“iPhone時刻”,以ChatGPT為代表的生成式AI讓每個人命令計算機解決問題成為了可能??蓪ι?產工具、對話引擎、個人助理等各類應用,起到協助人、服務人甚至超越人的角色。憑借此革命性突破,ChatGPT在搜 索引擎與各類工具軟件中率先掀起應用熱潮,引起了廣大用戶對ChatGPT相關技術的關注與學習。海量下游應用也因此 捕捉到新的技術與產業機會,希望通過各類大模型與工程化能力,將類ChatGPT產品能力輸送到原有的應用中,關于應用革命的序幕就此拉開。