Complete the description of the article for a correct work of the theme
香港新聞 八月 6, 2025
阿里巴巴統一千問團隊於2025年8月4日宣布開源其突破性圖像生成模型「Qwen-Image」,該模型擁有200億參數,並在圖像中文本渲染領域取得重大突破。Qwen-Image解決了現有AI圖像生成系統在準確呈現圖中文字,特別是中文及多語言文本方面的長期難題。
該模型在多項測試中展現卓越表現,能夠準確生成多行排版、段落級文本內容,以及細緻的書寫細節。無論是英文書籍的窗櫺文字,還是中國傳統書法對聯及手寫段落,都能高保真地呈現,展示出深刻理解視覺語言的能力。
不同於許多需收費或需專業硬體支持的專有系統,Qwen-Image採用Apache 2.0開源協議,允許用戶自由使用、修改及再分發。其優化的算法讓模型能在單張NVIDIA 3090顯卡的消費級設備上流暢運行,降低了先進AI圖像生成技術的門檻。
此外,Qwen-Image在通用圖像生成及編輯評測中均獲得領先名次,支持風格轉換、物件插入與移除、細節增強等多種高級圖像處理功能,也涵蓋物件檢測、語義分割與深度估算等圖像理解任務。目前模型已上線於Hugging Face、GitHub、ModelScope及Qwen Chat等多平台,方便即時體驗與應用。
阿里巴巴此次開源發布標誌著開源AI技術發展的重要里程碑,預計將加速多語言視覺內容的創作生態,促使市場競爭格局重塑,推動更多開放創新。