Samsung оценява реалната продуктивност на AI модели в бизнеса
Samsung преодолява ограниченията на съществуващите бенчмаркове, за да оцени по-добре реалната продуктивност на AI модели в бизнес среда. Новата система, разработена от Samsung Research и наречена TRUEBench, има за цел да адресира нарастващото несъответствие между теоретичната AI производителност и нейната действителна полезност на работното място. Докато бизнесите по света ускоряват приемането на големи езикови модели, TRUEBench предлага по-точна оценка на тяхната ефективност в реални условия.