91无码视频一区|蜜臀福利在线观看|日韩一极黄色视频|色欲人妻少妇Av一区二区|婷婷香蕉视频欧美三级片黄色|一级A片刺激高潮|国产精品污污久久|日韩黄色精品日韩久久综合网|中国一级片电影在线|超碰乱码久久久免费

有道上線(xiàn)翻譯大模型,CEO 稱(chēng)已經(jīng)趕超 ChatGPT

商界觀察
2023-08-01

ChatGPT 出現(xiàn)之后,網(wǎng)易有道公司內(nèi)部大吵了一架。

 

吵架的話(huà)題導(dǎo)火索是,有道翻譯這款產(chǎn)品的下一步該如何走。這款產(chǎn)品在 2008 年上線(xiàn),是網(wǎng)易自主研發(fā)的,也是國(guó)內(nèi)首家統(tǒng)計(jì)機(jī)器翻譯線(xiàn)上引擎。

 

經(jīng)過(guò) 15 年的技術(shù)迭代,有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)在行業(yè)內(nèi)占據(jù)優(yōu)勢(shì)地位。第三方平臺(tái)的數(shù)據(jù)顯示,到目前為止,有道詞典月活用戶(hù)已經(jīng)超過(guò) 1 億,是國(guó)內(nèi)詞典翻譯市場(chǎng)的第一名。

 

通常而言,做翻譯相關(guān)產(chǎn)品,業(yè)內(nèi)的共識(shí)追求是,它能不能替代人工翻譯。一定程度上,現(xiàn)有的翻譯產(chǎn)品,已經(jīng)實(shí)現(xiàn)了這一目標(biāo)。

 

目標(biāo)實(shí)現(xiàn)了,然后呢?這之后,應(yīng)該怎么辦?換句話(huà)說(shuō),一項(xiàng)技術(shù)一旦超越了傳統(tǒng)能力,甚至超過(guò)人類(lèi)智力表現(xiàn)之后,最大的改變應(yīng)該是什么?

 

網(wǎng)易有道 CEO 周楓想明白了,前沿技術(shù)已經(jīng)在更新,翻譯再這樣做下去不行,必須要迭代。他想用大模型的方式,重新思考翻譯這款產(chǎn)品的邏輯。

 

最大的改變,應(yīng)該是讓翻譯產(chǎn)品的使用量大幅上升,就像福特做出了 ModelT 這款改寫(xiě)全球汽車(chē)產(chǎn)業(yè)發(fā)展的汽車(chē)。ModelT 的價(jià)格讓普通人都負(fù)擔(dān)得起,汽車(chē)變成所有人都可以用,這個(gè)時(shí)候,技術(shù)就真的改變世界了。

 

周楓告訴鈦媒體 APP,這些爭(zhēng)吵在注重技術(shù)的網(wǎng)易有道屬于常態(tài),他們內(nèi)部也經(jīng)常做這樣的事情。

 

他認(rèn)為,技術(shù)團(tuán)隊(duì)時(shí)常需要轉(zhuǎn)換腦筋。于是,他把翻譯團(tuán)隊(duì)這幫老同事再度聚集起來(lái),讓大家學(xué)習(xí)大語(yǔ)言模型的能力,試圖把翻譯這款產(chǎn)品在新的模型上跑起來(lái)。

 

大約過(guò)了四五個(gè)月之后,團(tuán)隊(duì)評(píng)測(cè)后發(fā)現(xiàn),這些工作是有效的,現(xiàn)有模型的性能和最后翻譯的質(zhì)量,已經(jīng)超過(guò)之前用的模型了。

 

但投入 " 燒錢(qián) " 的大模型,對(duì)于尚處于盈利階段掙扎的網(wǎng)易公司來(lái)說(shuō),是否劃算?公司研發(fā)和訓(xùn)練大模型的成本投入,又是否感到吃力?

 

今年第一季度,網(wǎng)易有道業(yè)績(jī)產(chǎn)生波動(dòng)。財(cái)報(bào)數(shù)據(jù)顯示,一季度,網(wǎng)易有道凈收入為 11.6 億元人民幣,同比減少 3.1%;凈虧損 2.1 億元,同比增加 101.9%,繼上個(gè)季度利潤(rùn)轉(zhuǎn)正后再次由盈轉(zhuǎn)虧;并且,有道一直引以為傲的硬件業(yè)務(wù)收入也下滑 16%。

 

" 做公司永遠(yuǎn)是這樣的,好東西都要錢(qián),好的也最貴,這不是新問(wèn)題,我們一定會(huì)管理好。" 周楓對(duì)鈦媒體 APP 表示。

 

他稱(chēng),現(xiàn)在做大模型效率還比較高,一方面是公司之前有一定的基礎(chǔ),另一方面,有道 Transformer 的優(yōu)化很強(qiáng),很早的時(shí)候,他們就能把 Transformer 裝到小設(shè)備里面。

 

并且,大模型的邊際成本非常低,復(fù)制模型不需要太多額外的成本。雖然有道的近百人的 AI 團(tuán)隊(duì),人數(shù)也不少,但總體上,不需要增加額外的特別大的投入。

 

在網(wǎng)易有道首席科學(xué)家段亦濤看來(lái),很多技術(shù)和資源都是一脈相承的。他告訴鈦媒體 APP,有道做大模型的過(guò)程,是在之前團(tuán)隊(duì)框架進(jìn)行的,并沒(méi)有額外的組建團(tuán)隊(duì)來(lái)做。

 

從 2016 年開(kāi)始,有道協(xié)同構(gòu)建 AI 基礎(chǔ)能力,同步組建語(yǔ)言、視覺(jué)、聲音等團(tuán)隊(duì),積累了有道神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、計(jì)算機(jī)視覺(jué)、智能語(yǔ)音 AI 技術(shù)、高性能計(jì)算 ( HPC)四個(gè)底層技術(shù)能力。

 

2017 年,有道就看上了主流技術(shù) Transformer,將 AI 能力統(tǒng)一在大模型之下,重視在端側(cè)的落地應(yīng)用。2019 年,有道詞典筆 2 代的產(chǎn)品中,首次搭載離線(xiàn) Transformer NMT。2022 年,有道詞典筆 P5 中搭載了自研的離線(xiàn) ASR,已升級(jí)為 Transformer 技術(shù)。

 

用大模型做翻譯產(chǎn)品,周楓公開(kāi)表示,在內(nèi)部的測(cè)試中,在中英互譯的方向上,已經(jīng)超越 ChatGPT 的翻譯能力,也超過(guò)了谷歌翻譯的水準(zhǔn)。

 

不過(guò),基于大模型的翻譯產(chǎn)品,一個(gè)非?,F(xiàn)實(shí)的問(wèn)題是,它的成本較之前是有所提升的。周楓對(duì)鈦媒體 APP 透露,內(nèi)部經(jīng)過(guò)測(cè)算,用大模型做翻譯,因?yàn)橛?jì)算量非常大,查詢(xún)一次的成本,要比之前的模型貴近 20 倍,而有道的翻譯產(chǎn)品,現(xiàn)在每天大約要承接幾億次的查詢(xún)量。

 

雖然讓大模型翻譯大量被使用是周楓的目標(biāo),但他也發(fā)現(xiàn),大模型的確是燒錢(qián),尤其是在最開(kāi)始的時(shí)候,會(huì)有一些成本上的困難。他們目前需要資金,因?yàn)榇_實(shí)現(xiàn)有的東西,不滿(mǎn)足他們對(duì)產(chǎn)品的要求。

 

這樣的投入吃緊的現(xiàn)實(shí),也可能改變翻譯這類(lèi)產(chǎn)品的商業(yè)模式。不同于以往翻譯產(chǎn)品的流量轉(zhuǎn)化廣告變現(xiàn)的邏輯,周楓告訴鈦媒體 APP,對(duì)大模型翻譯來(lái)說(shuō),付費(fèi)會(huì)員制是目前比較合理的方案。

 

不過(guò),大模型也已經(jīng)引來(lái)教育界的 " 封殺 "。美國(guó)多所公立學(xué)校已經(jīng)禁用了 ChatGPT, 多家科學(xué)期刊也禁止將 ChatGPT 列為論文 " 合著者 "。

 

周楓也反對(duì)學(xué)生在學(xué)習(xí)的過(guò)程中用大模型 " 抄答案 " 的行為,在應(yīng)用端體現(xiàn)為 " 家長(zhǎng)管控 " 功能,可以管控識(shí)別答案,給出講解,而不是直接給出最后的答案。

 

不用去把大模型去神圣化。周楓說(shuō),我們應(yīng)當(dāng)對(duì)大模型里面的產(chǎn)品和技術(shù)創(chuàng)新做到具體案例具體分析,不能認(rèn)為大模型是一切事物的通途,更值得研究的是,在豐富的應(yīng)用場(chǎng)景。應(yīng)用和場(chǎng)景是整個(gè)變革的過(guò)程中,大家應(yīng)該及早去抓的。因?yàn)樽サ迷皆?,后邊能抓到的東西越多。

 

不只是網(wǎng)易有道,教育界也有一些公司對(duì)大模型的積極擁抱。今年 5 月,學(xué)而思正在研發(fā)數(shù)學(xué)大模型 MathGPT 的消息引發(fā)行業(yè)熱議。

 

彼時(shí),學(xué)而思方面對(duì)鈦媒體 APP 表示,MathGPT 以數(shù)學(xué)領(lǐng)域的解題和講題算法為核心,目前已經(jīng)取得階段性成果,并將于年內(nèi)推出基于該自研大模型的產(chǎn)品級(jí)應(yīng)用。

 

今年 7 月初,學(xué)而思一次發(fā)布會(huì)上透露可能該月底會(huì)有相關(guān)成果的對(duì)外展示。不過(guò),截至目前,他們還沒(méi)有相關(guān)進(jìn)展對(duì)外披露。

 

這背后或許是相對(duì)于其他領(lǐng)域,數(shù)學(xué)大模型難度頗高。

 

數(shù)學(xué)大模型要解決的三個(gè)難題在于,第一,題目要解對(duì),現(xiàn)在 GPT 結(jié)果經(jīng)常出現(xiàn)錯(cuò)誤;第二,解題步驟要穩(wěn)定、清晰,現(xiàn)在 GPT 的解題步驟每次都不一樣,而且生成內(nèi)容經(jīng)常很冗余;第三,解題要講得有趣、個(gè)性化,現(xiàn)在 GPT 的解釋過(guò)于 " 學(xué)術(shù) " 和機(jī)械,對(duì)孩子的學(xué)習(xí)體驗(yàn)很不友好。

 

周楓則認(rèn)為,數(shù)學(xué)大模型是大家都想投入的方向,但只是給數(shù)學(xué)大模型 " 投喂 " 再多的內(nèi)容,都不適用于數(shù)學(xué)領(lǐng)域,它背后涉及的是一些數(shù)學(xué)原理性的問(wèn)題,現(xiàn)在的大模型還不具備這樣的能力,但這仍是一個(gè)值得研究的方向。

 

鈦媒體 APP 了解到,新東方、作業(yè)幫等教培巨頭內(nèi)部,也已經(jīng)把目光盯緊大模型,但目前暫未有公開(kāi)落地的成果。

 

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。

免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com