OpenAI創(chuàng)始人山姆·奧特曼曾說:“十年前的傳統(tǒng)觀點認(rèn)為,人工智能首先會影響體力勞動,然后是認(rèn)知勞動,再然后,也許有一天可以做創(chuàng)造性的工作。現(xiàn)在看起來,它會以相反的順序進(jìn)行。”ChatGPT的出現(xiàn)印證了這一點!
ChatGPT的一炮而紅即將為OpenAI帶來約290億美元的融資,然而這樣的成功背后不止有技術(shù)天才和資金,2022年OpenAI的預(yù)訓(xùn)練語言模型在技術(shù)路線上作出了新的選擇:“基于人工標(biāo)注數(shù)據(jù)+強(qiáng)化學(xué)習(xí)的推理和生成”。據(jù)美國《時代》雜志調(diào)查發(fā)現(xiàn),為訓(xùn)練ChatGPT,OpenAI招募了大量數(shù)據(jù)標(biāo)注人員,甚至還投入了大量博士級別的專業(yè)人士來完成高質(zhì)量的標(biāo)注任務(wù),著眼長遠(yuǎn),將大量資金投入在人工數(shù)據(jù)標(biāo)注上是OpenAI成功的關(guān)鍵決策。
OpenAI在博客中寫道,ChatGPT是從GPT3.5系列中的模型進(jìn)行微調(diào)而誕生的。以往的預(yù)訓(xùn)練模型都是為了減少監(jiān)督學(xué)習(xí)對高質(zhì)量標(biāo)注數(shù)據(jù)的依賴。而正是ChatGPT在GPT-3.5大規(guī)模語言模型的基礎(chǔ)上,又開始依托大量人工標(biāo)注數(shù)據(jù),才得以實現(xiàn)理解人類指令,更精準(zhǔn)更有“人味”的自動輸出。
業(yè)內(nèi)普遍認(rèn)為,ChatGPT是人工智能里程碑,更是分水嶺,這意味著AI技術(shù)發(fā)展到臨界點。在人工智能領(lǐng)域深耕數(shù)十年的百度能否乘其東風(fēng)完成自我變革,引發(fā)業(yè)界關(guān)注。在外界看來,ChatGPT或成為下一代搜索產(chǎn)品的雛形。
另一方面,互聯(lián)網(wǎng)在擁有知識的同時也存在惡意和偏見的內(nèi)容,通過數(shù)據(jù)標(biāo)注建立一個額外的人工智能驅(qū)動的安全機(jī)制,運用文本分類標(biāo)注、對話語料構(gòu)建等標(biāo)注類型來幫助模型調(diào)優(yōu),OpenAI才能控制這種危害,生產(chǎn)出適合日常使用的聊天機(jī)器人,避免出口成臟,性別歧視或者發(fā)表種族主義言論的出現(xiàn)。
盤石數(shù)據(jù)標(biāo)注助力AI語音模型的進(jìn)化發(fā)展
盤石數(shù)據(jù)深耕數(shù)據(jù)標(biāo)注業(yè)務(wù),積累了豐富的文本標(biāo)注經(jīng)驗并針對語音模型訓(xùn)練提供優(yōu)質(zhì)的標(biāo)注服務(wù),包括:
對話評價——從多個方面針對自動生成的對話進(jìn)行評價,如情感、正確性、流暢性等多個方面。
故事改寫——根據(jù)情節(jié)對自動生成的故事進(jìn)行改寫,使其語義通順,邏輯完整。
摘要抽取——針對長文本進(jìn)行摘要抽取,保證情節(jié)完整,篇幅簡短,表達(dá)流暢。
邏輯推理——根據(jù)推理題目的信息,給出正確答案并提供解題思路。
角色扮演——構(gòu)建角色并與該角色進(jìn)行對話,避免出現(xiàn)邏輯錯誤、人設(shè)不符、不通順、錯字等情況。
以下為ChatGPT關(guān)于“數(shù)據(jù)標(biāo)注”的觀點
國際領(lǐng)先的基礎(chǔ)數(shù)據(jù)服務(wù)商——盤石數(shù)據(jù)
遼寧盤石數(shù)據(jù)科技有限公司是一家擁有自然語言處理技術(shù)(NLP)基因的人工智能基礎(chǔ)能力服務(wù)商,從數(shù)據(jù)(Data)、 算法(Algorithm)、人才(Talent)、智能應(yīng)用(Application)、服務(wù)(Service)全方位助力人工智能發(fā)展。為全球提供有競爭力的“DATAS”數(shù)據(jù)建設(shè)解決方案。
業(yè)務(wù)合作可直接與我司取得聯(lián)系,18640068358(微信同步),我們會在第一時間回復(fù)您。
免責(zé)聲明:市場有風(fēng)險,選擇需謹(jǐn)慎!此文僅供參考,不作買賣依據(jù)。
關(guān)鍵詞: