接前文,人工智能模型的兩個(gè)主要類型–生成式AI和決策式AI。 決策式AI擅長(zhǎng)的是對(duì)新的場(chǎng)景進(jìn)行分析、判斷和預(yù)測(cè),主要應(yīng)用在人臉識(shí)別、推薦系統(tǒng)、風(fēng)控系統(tǒng)、精準(zhǔn)營(yíng)銷、機(jī)器人、自動(dòng)駕駛等; 生成式AI主要擅長(zhǎng)自動(dòng)生成全新內(nèi)容,主流的內(nèi)容形式它基本都能生成,包含文本、圖片、音頻和視頻等。而目前大熱的GPT、DeepSeek也都是生成式AI。 所以這篇詳解一下生成式AI 的原理、主要模型和應(yīng)用場(chǎng)景。 生成式AI 的流程原理
數(shù)據(jù)收集和學(xué)習(xí)生成式 AI 首先需要收集海量的數(shù)據(jù),這些數(shù)據(jù)可以是文本、圖像、音頻等各種形式。例如要訓(xùn)練一個(gè)生成繪畫(huà)的 AI,就需要收集大量的繪畫(huà)作品。然后,AI 會(huì)像一個(gè)勤奮的學(xué)生一樣,仔細(xì) “觀察” 這些數(shù)據(jù),去發(fā)現(xiàn)其中的規(guī)律,比如圖像中顏色是怎么分布的、線條是如何組合的,文本中詞語(yǔ)是怎樣搭配的、句子結(jié)構(gòu)是怎樣的等。 神經(jīng)網(wǎng)絡(luò)搭建生成式 AI 會(huì)使用一些特殊的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),比如生成對(duì)抗網(wǎng)絡(luò)(GAN)、變分自編碼器(VAE)、Transformer 等。以 GAN 為例,它有兩個(gè)主要部分,一個(gè)是生成器,一個(gè)是判別器。生成器負(fù)責(zé)生成新的數(shù)據(jù),判別器負(fù)責(zé)判斷生成的數(shù)據(jù)是真實(shí)的還是生成的。它們倆就像在玩一個(gè)對(duì)抗游戲,在不斷對(duì)抗的過(guò)程中,雙方的能力都不斷提升,生成器生成的數(shù)據(jù)就越來(lái)越逼真。 學(xué)習(xí)與調(diào)整參數(shù)在學(xué)習(xí)過(guò)程中,AI 會(huì)根據(jù)數(shù)據(jù)和設(shè)定的目標(biāo)來(lái)不斷調(diào)整神經(jīng)網(wǎng)絡(luò)中的參數(shù)。比如在生成文本時(shí),如果生成的句子不符合語(yǔ)法規(guī)則或者語(yǔ)義不通,AI 就會(huì)根據(jù)損失函數(shù)計(jì)算出的結(jié)果來(lái)調(diào)整參數(shù),讓下次生成的文本更準(zhǔn)確、更合理。這個(gè)過(guò)程就像我們?cè)趯W(xué)習(xí)過(guò)程中不斷糾正自己的錯(cuò)誤,讓自己的表現(xiàn)越來(lái)越好。 生成新內(nèi)容當(dāng) AI 學(xué)習(xí)到一定程度后,就可以根據(jù)它所學(xué)到的知識(shí)和規(guī)律來(lái)生成新的內(nèi)容了。它會(huì)按照一定的概率分布來(lái)從學(xué)習(xí)到的模式中進(jìn)行采樣,從而創(chuàng)造出全新的數(shù)據(jù)。比如生成文本時(shí),它會(huì)根據(jù)詞語(yǔ)之間的關(guān)聯(lián)和句子結(jié)構(gòu)的規(guī)律,從它 “記憶” 的詞匯和表達(dá)方式中選擇合適的內(nèi)容來(lái)組成新的句子和段落。 生成式AI的核心價(jià)值決策式AI聚焦“知識(shí)”層面,生成式AI聚焦“邏輯”層面。 決策式AI基于大量數(shù)據(jù)、信息形成的知識(shí)總結(jié)和判斷,生成式AI是基于知識(shí)、信息和數(shù)據(jù)在邏輯層面生成的新內(nèi)容。所以相較于決策式AI ,生成式AI 的核心價(jià)值主要體現(xiàn)在主動(dòng)創(chuàng)造能力和突破現(xiàn)有模式的潛力上。生成式AI能夠主動(dòng)創(chuàng)造全新的內(nèi)容(如文章、圖像、代碼),突破人類經(jīng)驗(yàn)局限,降低 “創(chuàng)新門檻”,激發(fā) “無(wú)限可能性”。 生成式AI的底層架構(gòu)我們目前提到的生成式AI 都屬于深度學(xué)習(xí)模型。 深度學(xué)習(xí)是建立在計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)理論和機(jī)器學(xué)習(xí)理論上的科學(xué),經(jīng)典算法架構(gòu)是DNN架構(gòu)、CNN架構(gòu),隨著技術(shù)的發(fā)展,也出現(xiàn)了比較著名的Transformer架構(gòu)。
Transformer架構(gòu)是文本生成流域的主流架構(gòu),也是目前GPT等LLM大語(yǔ)言模型的底層架構(gòu);
除此之外還有
生成式AI的應(yīng)用場(chǎng)景生成式AI的幾種架構(gòu),目前可以支持生成文字、圖像、視頻、音頻等等。
生成式 AI 與智能體智能體的本質(zhì):具備感知、決策、行動(dòng)能力的自主性系統(tǒng),能在動(dòng)態(tài)環(huán)境中實(shí)現(xiàn)目標(biāo)。 生成式 AI 與智能體的結(jié)合推動(dòng) AI 系統(tǒng)向 “智能 + 創(chuàng)造力” 方向進(jìn)化。 客服智能體核心功能:模擬真人交互,處理客戶咨詢、售后、投訴等服務(wù)。 典型場(chǎng)景: 多渠道客服 電商平臺(tái) 7×24 小時(shí)在線回復(fù)商品咨詢,如自動(dòng)推薦商品、解答退換貨流程。 金融機(jī)構(gòu)處理賬戶查詢、貸款申請(qǐng)等問(wèn)題,支持語(yǔ)音、文字多模態(tài)交互。 智能分流與協(xié)作 根據(jù)問(wèn)題類型自動(dòng)轉(zhuǎn)接人工客服,或協(xié)同人類客服完成復(fù)雜任務(wù)。 情感識(shí)別與安撫 通過(guò)分析客戶情緒(如憤怒、焦慮),調(diào)整回復(fù)策略,提供安撫話術(shù)。 員工智能體核心功能:替代或輔助人類員工完成重復(fù)性、高耗時(shí)任務(wù)。 典型場(chǎng)景: 醫(yī)療健康領(lǐng)域 輔助醫(yī)生進(jìn)行病歷錄入、隨訪管理。 自動(dòng)生成體檢報(bào)告、用藥提醒,提升醫(yī)療效率。 制造業(yè) 工廠設(shè)備巡檢與故障預(yù)測(cè),實(shí)時(shí)分析傳感器數(shù)據(jù)并生成維護(hù)建議。 生產(chǎn)線質(zhì)量檢測(cè),通過(guò)圖像識(shí)別自動(dòng)標(biāo)記缺陷產(chǎn)品。 金融與行政 財(cái)務(wù)智能體自動(dòng)處理發(fā)票審核、報(bào)銷流程,減少人工干預(yù)。 行政智能體管理會(huì)議安排、差旅預(yù)訂,優(yōu)化資源分配。 創(chuàng)意智能體核心功能:生成文字、圖像、視頻等創(chuàng)意內(nèi)容,輔助創(chuàng)作與決策。 典型場(chǎng)景: 廣告與營(yíng)銷 根據(jù)品牌調(diào)性生成廣告文案、海報(bào)設(shè)計(jì),如自動(dòng)匹配產(chǎn)品賣點(diǎn)與用戶畫(huà)像。 影視與游戲開(kāi)發(fā) 生成虛擬角色對(duì)話、動(dòng)態(tài)劇情分支,降低開(kāi)發(fā)成本。 藝術(shù)創(chuàng)作 基于用戶描述生成繪畫(huà)、音樂(lè)片段,或輔助藝術(shù)家完成靈感構(gòu)思。 教育內(nèi)容生成 自動(dòng)制作教學(xué)課件、實(shí)驗(yàn)?zāi)M場(chǎng)景,支持個(gè)性化學(xué)習(xí)路徑設(shè)計(jì)。 數(shù)據(jù)智能體核心功能:自動(dòng)化處理、分析數(shù)據(jù),提供決策支持。 典型場(chǎng)景: 跨系統(tǒng)數(shù)據(jù)整合 打通醫(yī)療、金融等領(lǐng)域多平臺(tái)數(shù)據(jù)。 實(shí)時(shí)分析與預(yù)警 監(jiān)測(cè)股市波動(dòng)、輿情趨勢(shì),生成風(fēng)險(xiǎn)提示報(bào)告。 預(yù)測(cè)性維護(hù) 分析設(shè)備運(yùn)行數(shù)據(jù),預(yù)測(cè)故障概率并生成維護(hù)計(jì)劃。 商業(yè)智能 生成銷售趨勢(shì)圖表、用戶行為分析報(bào)告,輔助企業(yè)制定營(yíng)銷策略。 代碼智能體核心功能:自動(dòng)化編寫(xiě)、調(diào)試代碼,提升開(kāi)發(fā)效率。 典型場(chǎng)景: 全棧開(kāi)發(fā)輔助 根據(jù)需求描述生成完整項(xiàng)目框架。 自動(dòng)遷移代碼語(yǔ)言(如 Python 轉(zhuǎn) Java),適配不同技術(shù)棧。 測(cè)試與運(yùn)維 生成單元測(cè)試腳本、自動(dòng)化部署工具。 數(shù)據(jù)分析與可視化 根據(jù)自然語(yǔ)言指令生成 SQL 查詢、數(shù)據(jù)處理腳本。 低代碼開(kāi)發(fā) 非技術(shù)人員通過(guò)對(duì)話式交互生成業(yè)務(wù)邏輯代碼,快速驗(yàn)證產(chǎn)品原型(如初創(chuàng)企業(yè) MVP 構(gòu)建)。 本文由 @思睿 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。 題圖來(lái)自Unsplash,基于CC0協(xié)議。 該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。 |