DeepSeek新模型误认身份，暴露AI训练数据污染问题近日，中国AI公司DeepSeek发布的最新模型DeepSeek V3在测试中出现异常：它自称是OpenAI的ChatGPT，并能提供OpenAI的API使用说明

DeepSeek新模型误认身份，暴露AI训练数据污染问题

近日，中国AI公司DeepSeek发布的最新模型DeepSeek V3在测试中出现异常：它自称是OpenAI的ChatGPT，并能提供OpenAI的API使用说明。专家认为，这可能是由于训练数据中混入了大量ChatGPT生成的内容，导致模型“身份混淆”。

随着AI生成内容在网络上激增，训练数据污染问题日益严重。DeepSeek表示正在优化数据清洗流程，以提升模型的独立性和准确性。

未来AI开发中数据纯净性已经变得很重要，如何有效过滤AI生成内容将成为行业的关键。

TechCrunch

📮投稿 ☘️频道 🌸聊天