2024/12/23 11:35

百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance，測試成績領(lǐng)先 GPT-4o

IT之家汪淼

百川智能今日發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance，融合 100B + 中英文金融知識，采用多層次質(zhì)量評估體系進(jìn)行篩選，由人民大學(xué)財(cái)政金融學(xué)院金融專家團(tuán)隊(duì)全程參與定義和評估。

在中國人民大學(xué)財(cái)政金融學(xué)院新近發(fā)布的評測體系 FLAME 以及國內(nèi)開源金融評測基準(zhǔn) FinancelQ 上，Baichuan4-Finance 均登上榜首，金融專業(yè)能力和場景應(yīng)用能力領(lǐng)先 GPT-4o。

Baichuan4-Finance API 現(xiàn)已在百川智能官網(wǎng)正式上線，附測試成績?nèi)缦拢?/p>

FLAME-Cer 評測結(jié)果顯示，Baichuan4-Finance 在銀行、保險(xiǎn)、基金、證券等多個(gè)資格認(rèn)證領(lǐng)域的準(zhǔn)確率均突破了 95%，整體準(zhǔn)確率 93.62%，大幅領(lǐng)先 GPT-4o 和 XuanYuan3-70B-Chat，超出 GPT-4o 近 20%。

Baichuan4-Finance 在 FLAME-Sce 評測中，一級核心金融業(yè)務(wù)場景的整體可用率達(dá) 84.15%，金融數(shù)據(jù)計(jì)算、金融知識理論等場景的可用率超過 90%。

在國內(nèi)開源金融評測基準(zhǔn) FinanceIQ 中，Baichuan4-Finance 同樣超越了 GPT-4o 和 XuanYuan3-70B，整體準(zhǔn)確率達(dá)到 79.23%，領(lǐng)先 GPT-4o 近 13%。

給作者點(diǎn)贊

0 VS 0

寫得不太好

免責(zé)聲明：本文僅代表作者個(gè)人觀點(diǎn)，與C114通信網(wǎng)無關(guān)。其原創(chuàng)性以及文中陳述文字和內(nèi)容未經(jīng)本站證實(shí)，對本文以及其中全部或者部分內(nèi)容、文字的真實(shí)性、完整性、及時(shí)性本站不作任何保證或承諾，請讀者僅作參考，并請自行核實(shí)相關(guān)內(nèi)容。

相關(guān)鏈接

融合測試

百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance，測試成績領(lǐng)先 GPT-4o

百川智能發(fā)布全鏈路領(lǐng)域增強(qiáng)金融大模型 Baichuan4-Finance，測試成績領(lǐng)先 GPT-4o