Vila - 搜索 News

千寻智能是一家具身智能与通用人形机器人技术研发商，公司构建了高泛化、高通用机器人大脑。产品运用了视觉语言模型ViLa（Vision-and-Language Models）和部件约束模型CoPa（Constraints of Parts）模型，作为具身智能机器人底层的多模态大模型。致力于打造行业领先的 ...

来自MSN12 分钟

一篇大模型数据合成和增强技术最新综述

例如，VILA-2利用自我增强过程，使用当前轮次的VILA生成详细说明，以用于下一轮预训练。通用模型蒸馏（General Model Distillation）：通用模型蒸馏指的是使用具有强大能力的通用LLM来蒸馏高质量数据。例如，Phi-1和Phi-1.5利用GPT-3.5生成的代码数据集进行预训练 ...

腾讯网13 天

一块显卡理解一部完整电影！智源联合多所高校推出小时级的超长 ...

Video-XL借助语言模型（LLM）的原生能力对长视觉序列进行压缩，不仅保留了短视频理解的能力，而且在长视频理解上展现了出色的泛化能力。Video-XL相较于同等参数规模的模型，在多个主流长视频理解基准评测的多项任务中排名第一。此外，Video-X ...

13 天

一张显卡“看懂”一部电影：智源联合高校开源 Video-XL，打破长视频 ...

长视频理解是多模态大模型的核心能力之一，也是迈向通用人工智能（AGI）的关键一步。然而，现有的多模态大模型在处理 10 分钟以上的超长视频时，仍然面临性能差和效率低的双重挑战。

新智元 on MSN13 天

一张显卡看遍天下电影！智源联合高校开源Video-XL打破长视频理解 ...

编辑：编辑部 HYZ 【新智元导读】长视频理解迎来新纪元！智源联手国内多所顶尖高校，推出了超长视频理解大模型Video-XL。仅用一张80G显卡处理小时级视频，未来AI看懂电影再也不是难事。长视频理解是多模态大模型的核心能力之一，也是迈向 ...

搜狐9 天

我把「我的车库」，藏在了混凝土和钢铁之后

这是一幢位于丹麦的空间设计案例，被取名为Vila Kirk，其是一块集展示、娱乐、休闲和招待的综合空间结构，总面积有近千平，该空间的设计风格将山洞元素，混凝土风格以及具有阳光的干净的斯堪的纳维亚简约开放空间的风格结合起来。这里有地下展厅 ...

2 天

徕卡Cine Play 1 多功能迷你投影仪,方便灵活,尽享徕卡出色画质观影体验

除了出色画质，徕卡Cine Play 1还拥有让人印象深刻的连通性和用户友好操作。这款智能迷你投影仪可以与用户心仪的设备和家庭娱乐系统进行丝滑的无缝连接。它还支持Apple Airplay、蓝牙和Wi-Fi连接，并配备了多个端口（包括HDMI，USB ...

14 天

葡萄牙巧克力节（Chocolat Festival）再度亮相波尔图

连续三年成功举办的葡萄牙巧克力节（Chocolat ...

5 天

最新受奥斯卡认证的162个电影节（收藏）

每年，奥斯卡奖都会公布纪录长片和三个短片单元（真人短片单元、纪录短片单元、动画短片单元）的资格赛名单。投奖狮整理了2024—2025年上半年第97届奥斯卡金像奖短片、动画片入围的认证节日名单，共有162个节日，较去年的172个略有减少。今年排名第一的国家是美国，占比35%，共57个电影节。名单中还包括柏林国际电影节、华沙国际电影节、塔林黑夜国际电影节等AB类电影节。需要注意的是，符合资格的电影节 ...

El Dictamen28 天

作者：Ignacio Gómez Bravo/El Dictamen

CHOCHOLER朋友怎么样！昨天墨西哥国家队对阵西班牙瓦伦西亚，一场精彩的TRI比赛；后天他们将对阵美国队，将会有向足球运动员安德烈斯·瓜尔达多致敬的活动……MX联赛中，墨西哥足球第12轮比赛即将到来，18月4日阿特拉斯将迎战马萨特兰，克雷塔罗将迎战托卢卡，NECAXA 将主办蒂华纳的 XOLOS，PUEBLA 将主办 BLUE CROSS；周六，他们将与帕丘卡队对阵奇瓦斯队，华雷斯勇士队将对阵 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果