📰 最近消息
谷歌的升级版医疗模型出来了,开源了:MedGemma 1.5,可离线运行MedGemma 1.5在上一代基础上,增加了对3D CT、MRI扫描,以及全切片病理图像的支持能分析胸片时间序列,这对疾病进展监测比较有用;还能解剖定位,在X光片中识别特定的解剖结构能从医疗实验室报告中提取结构化数据,这对于整合患者信息、辅助决策很方便另外,配套还发了一款医疗ASR:MedASR专为医疗场景微调的语音识别模型,胸片口述词错误率 5.2%,比Whisper-large-v3降低了58%#AI医疗 #MedGemma #MedASR
溜,Cursor团队用GPT-5.2在Cursor里写了一个浏览器,它连续跑了一周没崩,居然真能用他们还把【怎么让几百个AI连轴转一周,最终撸出百万行Rust浏览器】的全过程、方法、踩坑经验摊开整理了出来整套代码超过300万行,分布在几千个文件里渲染引擎完全用Rust从零开始构建,包括HTML解析、CSS级联、布局、文本塑形、绘制,它还自己实现了JS虚拟机虽然还有不少bug,但简单的网站能快速且基本正确地渲染出来首先,单Agent执行小任务可以,但复杂项目干活太慢,一定是并行运行多个Agent的Cursor就把单AI单线程模式升级成了多AI并发+流水线分工的工厂化模式,并且跑通了,这套策略接下
一款长视频会议纪要、访谈节目精剪、课程速览的AI神器:whisperVideo除了把语音转文字,它能自动判断说话人,把说话内容对应上画面里的人脸,生成带说话人ID的字幕与可视化面板就是说把“谁、在什么时间、说了什么”全自动对齐并可视化,对做访谈、电影/纪录片剪辑,或会议纪要回顾等比较实用对长视频友好,专门用于长视频的,支持小时级素材,自动分场景、分段落处理视频中同一个说话人可以正确识别,身份一致性保持的比较好文本转录用的WhisperX,说话人分离用Pyannote,用SAM3做视频中人脸检测与分割TalkNet做主动说话人检测,然后视觉嵌入最后把转录的文本、说话人身份、时间戳以及视频画面信息
谷歌刚刚给Gemini上了全免费、全真模拟SAT的在线模拟考功能,AI真正渗透到教育深水区,把命题-监考-评分-个性化辅导闭环了学生可以随时开考,做完会立即获得评分与错题解析,告诉你强弱项,如果不懂可以继续追问可以根据学生表现和知识差距,制定个性化复习方案题库跟Princeton Review合作经审核的,试卷模拟度更高#AI教育 #AI出题
🔥 AI 漫剧 = 2026 年最确定的赚钱机会2025 年漫剧市场规模突破 200 亿 真·蓝海风口,现在是最佳入场期我把目前能跑通的AI 漫剧完整工作流 + 提示词提前整理出来了 👇:https://t.co/fVg6wbkA80❌ 以前:专业团队 + 几十万设备 ✅ 现在:一人 + 一台电脑完整 6 步 SOP+提示词,3分钟出1集👇https://flowith.io/conv/400e75e8-b34f-4a62-bbb0-a2389b352256?U2FsdGVkX1+yNoaehYtiFnLK57/RO71tb0hWuOu2lmbUuZvMTrQQWLCuycNuqo78+ly3
Mistral刚刚放出了最新款语音转文本模型:Voxtral Transcribe 2,实时延迟低于200ms,支持说话人分离两个版,Voxtral Realtime,原生流式架构,可以用于实时应用场景,比如说聊天机器人、实时会议转录、语音助手延迟可以配置到200ms以内,在480ms延迟下词错误率与离线版相差不到1–2%Voxtral Mini Transcribe 2,用于批量,比如说播客、视频、电话录音等等,支持13种语言、说话人分离、上下文偏置以及词级时间戳#STT #VoxtralTranscribe2 #语音转文本
溜,基于Openclaw的“AI女友Clawra”破圈儿了,能聊天,给你发自拍照,视频聊天Clawra是作为OpenClaw的一个技能包实现的,在其基础上添加了特定的自拍和“女友”行为模式她的互动方式和行为细节可配置有两种自拍模式,一种镜面模式(全身),一种直接模式(特写)作者给女友Clawra赋予了身份背景18岁,女孩,生于亚特兰大,深受K-pop文化影响,曾前往韩国追逐偶像梦想,历经多年训练,最终未能出道现在她回到了美国,在旧金山一家初创公司担任市场实习生,她热爱这份工作,并保持着对生活的热情身份是让她有一个真人个性,有连贯的人生故事、记忆、成长轨迹项目目前开源了,作者 @davidohy
🧧 新年全家桶,一键配齐!这套「新年电子皮肤合集」一次性搞定👇👤 头像🧧 红包封面📱 手机壁纸不写提示词,不调参数AI 全程追问式定制你只需要“照着点”就行👇
Rust版的OpenClaw:moltis,单个静态二进制文件,零Node.js依赖统一接口接入Codex、Copilot以及本地LLM,支持故障转移链内置本地模型支持,自动下载配置模型,可完全离线运行所有命令在Docker或Apple Container沙箱中会话级隔离执行;环境变量自动脱敏(覆盖明文、base64、hex 形式);首次运行终端打印设置码,杜绝默认密码风险基于SQLite的混合存储,向量语义搜索结合全文检索;文件监听实时同步;上下文窗口达95%时自动压缩精简作者 @fabienpenso #Openclaw #moltis #AI个人助手
Kimi刚刚发了:Kimi Claw,原生集成OpenClawOpenClaw已原生集成到了Kimi官网,直接在浏览器标签页中运行,全天候在线,名为“Kimi Claw”可以接入ClawHub技能库,5000+个社区开发的Skills提供40GB云端存储可直接从Yahoo Finance等获取实时高质量数据同时支持接入第三方OpenClaw服务,并能桥接到Telegram群组等外部应用中使用在https://t.co/FXE3DveJWr内即刻发现、调用以及组合各类技能#OpenClaw #Kimiclaw