近日,中国AI公司DeepSeek发布的最新模型DeepSeek V3在测试中出现异常:它自称是OpenAI的ChatGPT,并能提供OpenAI的API使用说明。专家认为,这可能是由于训练数据中混入了大量ChatGPT生成的内容,导致模型“身份混淆”。
随着AI生成内容在网络上激增,训练数据污染问题日益严重。DeepSeek表示正在优化数据清洗流程,以提升模型的独立性和准确性。
未来AI开发中数据纯净性已经变得很重要,如何有效过滤AI生成内容将成为行业的关键。
TechCrunch
📮投稿 ☘️频道 🌸聊天