探索跳跃式思维链:DeepSeek创造力垫底,Qwen系列接近人类顶尖水平
2025-02-28
机器之心AIxiv专栏报道了关于多模态大语言模型(LLM)创造力评估的研究进展。研究指出,当前对LLM创造力的评估方法存在不足,难以构建合适的自动化评估流程。为解决这一问题,中大、哈佛等高校的研究者提出了一个多轮交互的创造力评估范式LoTbench,通过测量LLM生成高质量创新内容所需的轮数来评估其创造力。研究表明,尽管主流LLM在创造力方面表现一般,但有超越人类的潜力。


本页面内容由AI提炼生成,无法确保完全真实准确,不代表123彩票app稳定版下载
官方立场,不构成投资建议。如需阅读详细说明,请点击此处
