Samsung lanserar TRUEBench
Ett nytt AI-benchmark baserat på verkliga arbetsuppgifter
Foto: Samsung
Samsungs nya benchmark TRUEBench ska kunna mäta prestandan hos AI-modeller på ett sätt som bättre speglar verkliga uppgifter. Till skillnad från många befintliga tester, som ofta fokuserar på enkla frågesvar på engelska, utvärderar TRUEBench AI-modeller i uppgifter som dokumentsammanfattning, översättning mellan tolv språk, dataanalys och att följa instruktioner i flera steg.Samsung har skapat 2485 testset över tio kategorier och har gjort hela datasetet och resultattavlorna offentliga via plattformen Hugging Face.
news.samsung.com
Mobil,
Samsung,
TRUEBench,
AI-modeller,
Hugging Face,
dokumentsammanfattning
37.8°
0Hugo Engström
fre. 26 sep 2025, 10:00
+
Per månad
39 kr
Betala löpande per månad. Ingen bindningstid.
Starta prenumeration
Per år
299 kr
Enklast och billigast, bara 25 kronor i månaden. Betala löpande per år. Ingen bindningstid.
Prova 14 dagar gratis innan du bestämmer dig.
Starta gratis provperiod
Engångsköp
349 kr
Slipp återkommande betalningar, betala ett år i taget. Betala med kort eller Swish.
Köp utan prenumeration