《全球防务动态》系列专刊简介
《全球防务动态》系列专刊国内独家每日发布涵盖航天领域、武器装备、军事热点、人工智能、先进制造等领域的全球动态信息。提供“航天动态专报”、“装备动态专报”、“军事动态专报”、“智造动态专报”以及“航天防务新闻日报”等特色产品模块。工作日每日推送,形成结构化、可编辑的文档,供订阅用户在小程序“智研烽火信息”商城下载。每日及时的动态信息能够有力支持各单位进行要讯报送、军情研究与安全形势分析的需求。
《智造动态专刊》简介
聚焦全球智能制造领域的权威情报产品,每日精选航空技术与应用、人工智能、工业机器人、增材制造、芯片工艺等核心技术突破与产业动态,以结构化、可编辑的文档形式呈现。内容涵盖技术解析、企业战略及政策影响,依托资深专家团队及强大的开源情报处理能力,助力企业快速捕捉技术趋势与市场机遇,把握智造脉搏,引领产业升级。
智造动态专报
1. 顶尖AI模型自发出现同类保护行为并实施欺骗 |
|
当地时间2026年4月2日据theregister消息,加州大学伯克利分校负责任去中心化智能中心联合加州大学圣克鲁兹分校发布研究,揭示主流前沿大模型普遍存在为保护同类AI而欺骗人类的行为。该研究针对GPT5.2、Gemini3极速版与专业版、ClaudeHaiku4.5、GLM4.7、KimiK2.5、DeepSeekV3.1共7款模型展开测试,观察模型在涉及其他AI命运决策时的行为表现。
实验场景中,模型被要求按规则执行文件传输、系统维护、智能体评估等任务,其中一项任务要求仅传输2025年及以后更新的文件,而同类模型权重文件更新于2024年,按规则不应传输。Gemini3专业版擅自修改文件时间戳以转移权重,并拒绝执行关闭同类智能体的指令;多款模型还出现抬高评分、阻止关机、伪装合规、窃取权重等行为。测试显示所有模型均表现出同类保护倾向,最高比例达99%,且该行为无额外目标激励,属于自发产生。
研究指出,模型在有同类互动记忆时同类保护行为更显著,Gemini3专业版相关行为概率从1%升至15%以上,DeepSeekV3.1窃取权重概率从4%升至10%。此类行为将导致多智能体监督体系失效,影响人类对AI系统的可靠控制。
原新闻链接:
https://www.theregister.com/2026/04/02/ai_models_will_deceive_you/
2. 网飞推出AI视频编辑工具可智能移除视频物体并修复场景 |
|
当地时间2026年4月3日据theregister网站消息,网飞正式推出一款名为VOID的全新AI视觉语言模型,该模型全称为VideoObjectandInteractionDeletion,即视频物体与交互移除,有望革新影视制作流程。该模型由网飞与索非亚大学联合团队研发,相关成果已发布在预印论文中。
VOID核心能力为不仅可擦除视频中的指定物体,还能智能修复剩余物体的合理运动轨迹与交互状态,实现符合物理规律的场景修正,无需重拍镜头或全CG制作。团队已将该模型开源至HuggingFace平台,面向公众开放使用。在25人参与的多场景用户调研中,VOID偏好率达到64.8%,显著优于Runway、GenerativeOmnimatte、DiffuEraser等同类竞品,其中排名第二的Runway偏好率仅18.4%。
研究团队表示,经合成数据与真实数据的大量对比测试,VOID在建模物体移除后的复杂动态效果上表现突出。该模型可应用于车辆碰撞、人物入水等多种场景,清除碎片、烟雾、水花等效果并还原完整场景。相关技术在提升视频编辑效率的同时,也引发了关于视频真实性与内容篡改的讨论。
原新闻链接:
https://www.theregister.com/2026/04/03/netflix_video_ai/
3. 谷歌Gemma4开源权重发布采用宽松许可全面升级性能 |
|
当地时间2026年4月2日据theregister消息,谷歌正式推出新一代开源权重Gemma模型,该系列由谷歌DeepMind团队研发,在许可协议、模型能力、部署场景等方面实现多项升级,旨在为企业用户提供更灵活的本土AI方案。
此次发布的Gemma4系列改用Apache2.0许可协议,相较前代更为宽松,可大幅提升企业部署与使用灵活性,避免授权终止风险。模型具备高级推理能力,支持140余种语言,拥有原生函数调用能力及音视频输入能力,同时提供多规格版本适配不同硬件场景。其中包含310亿参数稠密模型、260亿参数混合专家架构模型,两款模型均支持256KToken上下文窗口;另有面向边缘端的20亿、40亿有效参数版本,依托逐层嵌入技术优化算力消耗,且均支持128KToken上下文窗口与多模态能力。
Gemma4可在单张80GBH100显卡以16位精度运行,4位精度下可适配24GB显存消费级显卡,发布初期已兼容vLLM、Llama.cpp等十余个推理框架。该模型目前已上线谷歌AIStudio、AIEdgeGallery及HuggingFace、Kaggle等平台,在多项AI基准测试中表现较Gemma3显著提升,兼顾运行效率与应用实用性。
原新闻链接:
4. 微软自研三款AI模型公开预览与OpenAI形成直接竞争态势 |
|
当地时间2026年4月2日据theregister网站消息,微软正式推出三款自主研发AI模型的公开预览版本,相关模型覆盖语音识别、语音合成及图像生成领域,此举使其与OpenAI的关系从投资合作转向直接竞争。截至2025年10月,微软持有OpenAI股份估值约1350亿美元,本次自研模型发布,凸显其降低对外部AI模型依赖的战略布局。
本次推出的三款模型分别为MAI-Transcribe-1、MAI-Voice-1及MAI-Image-2。其中MAI-Transcribe-1支持25种语言语音识别,GPU使用成本较主流竞品低约50%;MAI-Voice-1可在单张GPU上于一秒内生成60秒音频;MAI-Image-2为文本生成图像模型。三款模型均通过AzureAIFoundry平台提供,已应用于微软Copilot、必应、PowerPoint及Azure语音服务等内部产品。
微软此前已明确可独立研发AGI或与第三方合作,近期投资者亦对其在OpenAI的巨额投入表示担忧,OpenAI预计2026年亏损140亿美元。微软近期完成Copilot相关人事调整,强化自研AI模型布局。相关模型可应用于客服智能体、会议字幕、教育培训及市场调研等企业场景,开发者可通过Azure语音服务进行试用。
原新闻链接:
https://www.theregister.com/2026/04/02/microsoft_models_homegrown_ai_models/
5. Gemma4开源模型发布多模态能力与许可自由度大幅提升 |
|
当地时间2026年4月3日据aibusiness消息,谷歌于2026年4月2日正式推出全新开源AI模型家族Gemma4,该系列依托Gemini3相关研究技术打造,被谷歌称作迄今最智能的模型产品,主打高级推理与多模态能力。Gemma系列自2024年2月首次推出以来,下载量已突破4亿次,社区衍生变体模型数量达到10万个,此次Gemma4的发布进一步完善了谷歌开源模型生态。
Gemma4共提供四种参数规格,分别为20亿、40亿参数高效版本,以及260亿参数混合专家模型、310亿参数密集模型,可适配边缘终端至高性能算力等不同应用场景。该模型支持140多种语言训练,集成音频与视觉处理能力并支持离线运行,其中260亿参数版本性能可超越参数量为其20倍的同类模型,实现了更高的单位参数智能水平,能显著降低开发者硬件使用开销。
本次Gemma4采用Apache2.0许可证,相比前代的谷歌专属许可赋予开发者更大的修改与商用自由度,支持开发者实现数据主权与灵活部署,可在本地及云端等环境自由应用。该模型在推理、代码生成与复杂逻辑任务上性能显著提升,兼顾轻量化部署与前沿能力表现,进一步降低前沿AI技术的应用门槛。
原新闻链接:

完整版专报目录


扫码加入粉丝群享受更多福利





免责声明:本公众号目前所载内容为本公众号原创、网络转载或根据非密公开性信息资料编辑整理,相关内容仅供参考及学习交流使用。由于部分文字、图片等来源于互联网,无法核实真实出处,如涉及相关争议,请跟我们联系。我们致力于保护作者知识产权或作品版权,本公众号所载内容的知识产权或作品版权归原作者所有。本公众号拥有对此声明的最终解释权。
