系统极客一直在努力
专注操作系统及软件使用技能

微软发布 Phi-3-vision 高效视觉推理模型

Phi-3

在 Build 2024 大会上,微软为其 Phi-3 系列模型增添了一个新成员——Phi-3-vision。这是一个拥有 42 亿参数的模型,不仅能处理一般的视觉推理任务,还能理解图表、图形和表格,并进行推理。Phi-3-vision 可以同时接收图像和文本输入,并生成文本响应。

Phi-3 系列模型主打经济高效,针对设备端、边缘计算、离线推理以及对延迟敏感的 AI 场景进行了优化。有兴趣的开发者和爱好者,现在可以通过 Ollama on Windows 在本地安装并试用。

同时微软还宣布,在 Azure AI 的模型即服务(MaaS)中正式上线 Phi-3-mini。

赞(0) ¥ 赞赏
分享到

评论 抢沙发

微信赞赏