视觉 - 区块链加密货币研究中心

发表于 2026-01-24 OpenAI 视觉模型

PANews 8月8日消息，据9to5Mac报道，OpenAI今日发布最新GPT-5模型，Apple Intelligence将在iOS 26、iPadOS 26和macOS Tahoe 26系统更新

发表于 2026-01-21 研究者视觉 GPT

原文来源：机器之心图片来源：由无界 AI生成电子游戏已经成为如今现实世界的模拟舞台，展现出无限可能。以游戏《侠盗猎车手》（GTA）为例，在 GTA 的世界里，玩家可以以第一人称视角，在洛圣都（游戏

发表于 2026-01-21 REX 视觉图谱

来源：量子位‌ 用视觉来做Prompt，是种什么体验？只需在图里随便框一下，结果秒秒钟圈出同一类别！即便是那种GPT-4V都难搞定的数米粒的环节。只需要你手动拉一下框，就能找出所有米粒来。新的目

发表于 2026-01-21 先验时空视觉

原文来源：新智元图片来源：由无界 AI生成 STKET框架将先验时空知识纳入多头交叉注意机制中，从而可以学习到更多有代表性的视觉关系表示，在视频图生成基准上大幅领先其他算法。视频场景图生成（Vid

发表于 2026-01-21 Palanker PRIMA 植入物

经过数十年的反复试验，斯坦福医学院的科学家们为盲人患者带来了医学上罕见的奇迹——重见光明的机会。他们的无线 PRIMA 植入物，描述本周《新英格兰医学杂志》刊登的一篇文章，利用不可见光和米粒大小

发表于 2026-01-21 Midtravel 视觉图像

指南：如何在中途使用参考照片？简介：可能性的画布激发想象：旅途中参考照片的力量释放创意潜力在创意表达领域，Midtravel成为一种强大的工具，为用户提供生成独特迷人图像的能力。增强创作过程

发表于 2026-01-21 ViLa 视觉 GPT

来自清华大学交叉信息研究院的研究者提出了「ViLa」（全称 Robotic Vision-Language Planning）算法，其能在非常复杂的环境中控制机器人，为机器人提供任务规划。原文来源：

发表于 2026-01-21 视觉实验室计算机

原文来源：量子位据多方消息证实，商汤科技创始人、香港中文大学教授汤晓鸥，在睡梦中不幸离世，享年55岁。有商汤人士称：你真的不知道明天先来还是无常先来，巨星陨落，天妒英才，沉痛悼念。中国计算

发表于 2026-01-21 序列视觉图像

来源：新智元图片来源：由无界 AI生成 UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型，第一次证明纯CV模型也是可扩展的。更令人震惊的是，LVM竟然也能做对图形推理题，AGI火花再次出现了？

发表于 2026-01-21 皮层刺激物幻觉

原文来源：追问nextquestion 图片来源：由无界 AI生成当看见两组线条光栅紧挨在一起，彼此稍有错位时，我们脑海中似乎会出现一条实际上并不存在的线。这条线仿佛在两组实际线条间弯曲延伸（图1C