DeepSeek-V4:中国AI技术栈的严肃展望
Silicon.fr · 04-24 16:18 2026-04-24
网络安全,被恐惧所囚禁
Silicon.fr · 04-23 13:50
Arm发布其首款处理器
VIPress.net · 04-20 16:08
Filters
Clear All
偏见、幻觉……法语中最“稳健”的大语言模型

Biais, hallucinations… Les LLM les plus « robustes » en français

法国公司Giskard与Google DeepMind合作开发的基准测试Phare显示,主流大语言模型在英语表现通常优于法语,但存在例外。测试涵盖偏见、幻觉、抗越狱等10个模块,结果显示:在偏见检测中,Llama模型在法语表现反超英语;在事实性方面,Gemini模型领先;而Anthropic的Claude系列在识别虚假信息方面表现突出。该评估揭示了不同模型在多语言环境下的性能差异与特定优势。

Silicon.fr 人工智能 科研 STMicroelectronics Silicon.fr OpenAI