GPT-4 已经宣告一个多月了 ,天近但识图功能仍是差体体验不了 。来自阿卜杜拉国王科技大学的天近钻研者推出了相似产物 ——MiniGPT-4 ,巨匠可能上手体验了。差体
对于人类来说 ,天近清晰一张图的差体信息,不外是天近一件微乎其微的小事,人类简直不用思考 ,差体就能随口说出图片的天近寄义 。就像下图 ,差体手机插入的天近充电器多少多有点不适宜。人类一眼就能看出下园地址,差体但对于 AI 来说 ,天近难度还黑白常大的差体 。
GPT-4 的天近泛起,开始让这些下场变患上重大 ,它能很快的指出图中下园地址 :VGA 线充 iPhone 。
着实 GPT-4 的魅力远不迭此 ,更炸场的是运用手绘草图直接天生网站 ,在底稿纸上画一个纰漏的展现图,拍张照片,而后发给 GPT-4,让它凭证展现图写网站代码,嗖嗖的,GPT-4 就把网页代码写进去了 。
但遗憾的是 ,GPT-4 这一功能当初仍未向公共凋谢 ,想要上手体验也无从谈起。不外,已经有人等不迭了 ,来自阿卜杜拉国王科技大学(KAUST)的团队上手开拓了一个 GPT-4 的相似产物 ——MiniGPT-4。团队钻研职员搜罗朱德尧、陈军、沈晓倩、李祥、Mohamed H. Elhoseiny,他们均来自 KAUST 的 Vision-CAIR 课题组 。
论文地址 :https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf
论文主页:https://minigpt-4.github.io/
代码地址