(網(wǎng)經(jīng)社訊)1月22日消息,網(wǎng)易有道正式推出國(guó)內(nèi)首個(gè)輸出分步式講解的推理模型“子曰-o1”。這款14B參數(shù)規(guī)模的輕量級(jí)單模型能夠在消費(fèi)級(jí)顯卡上部署,特別適合教育領(lǐng)域的應(yīng)用。作為一款專注于思維鏈技術(shù)的模型,子曰-o1能夠提供細(xì)致的解題過(guò)程,模擬人類的思考方式,通過(guò)自言自語(yǔ)和自我糾錯(cuò)的方式逐步推導(dǎo)出最終答案。
子曰-o1的設(shè)計(jì)理念在于解決當(dāng)前大模型在低顯存設(shè)備上運(yùn)行不穩(wěn)定的問(wèn)題。盡管其參數(shù)規(guī)模較小,但該模型依然能夠?qū)崿F(xiàn)高質(zhì)量的推理能力,與云端部署的質(zhì)量相媲美。這使得它不僅可以在消費(fèi)級(jí)硬件上流暢運(yùn)行,還能提供與大型模型相當(dāng)?shù)慕忸}準(zhǔn)確性和邏輯推理能力。
作為一個(gè)教育垂類模型,子曰-o1的特性使其非常適合應(yīng)用于教育產(chǎn)品中。它通過(guò)清晰呈現(xiàn)有條理的解題過(guò)程,以啟發(fā)式講解引導(dǎo)學(xué)生提升自主思考能力。例如,在解題過(guò)程中,子曰-o1會(huì)形成較長(zhǎng)的思維鏈條,使解題思路更接近于人類的思考模式,并通過(guò)詳細(xì)的步驟展示,幫助學(xué)生理解每一步驟的邏輯。
此外,為了進(jìn)一步優(yōu)化教育場(chǎng)景的應(yīng)用效果,子曰-o1從數(shù)據(jù)篩選到訓(xùn)練指令等多個(gè)方面進(jìn)行了改進(jìn)。基于有道多年來(lái)在教育領(lǐng)域的數(shù)據(jù)資源積累,該模型使用了大量的教育領(lǐng)域?qū)W生試卷習(xí)題作為訓(xùn)練樣本,從而提升了其在教育場(chǎng)景中的準(zhǔn)確性。目前,子曰-o1已在“有道小P”中落地應(yīng)用,支持其實(shí)現(xiàn)先提供解析思路再提供答案的答疑過(guò)程,引導(dǎo)學(xué)生主動(dòng)思考并自主解決問(wèn)題,真正將知識(shí)學(xué)透。
總的來(lái)說(shuō),子曰-o1憑借其輕量化設(shè)計(jì)、分步式講解以及中文邏輯推理等優(yōu)勢(shì),能夠以較低的落地門檻撬動(dòng)更高的應(yīng)用價(jià)值,為相關(guān)開發(fā)者提供了一個(gè)實(shí)用高效的工具。隨著推理模型賽道的不斷擴(kuò)大,子曰-o1將作為起點(diǎn),持續(xù)釋放其在教育領(lǐng)域內(nèi)的應(yīng)用潛力。堅(jiān)持“場(chǎng)景為先”的理念,子曰-o1已經(jīng)擁有較通用大模型更為專業(yè)的預(yù)訓(xùn)練語(yǔ)料,可以根據(jù)用戶在學(xué)習(xí)場(chǎng)景下的需求,幫助用戶答疑解惑。