📰 科技热点资讯 · 2026-03-19

今日AI领域热点：

📰 AI 博客每日精选 — 2026-03-19

来自 Karpathy 推荐的顶级技术博客，精选 Top 10

今日AI领域热点：

🥇 Autoresearching Apple's "LLM in a Flash" to run Qwen 397B locally

阅读原文 — simonwillison.net · 11小时前

Dan Woods利用苹果2023年论文"LLM in a flash"的技术，成功在48GB MacBook Pro M3 Max上运行Qwen3.5-397B-A17B模型，达到5.5+ tokens/秒的速度。该模型采用MoE架构，通过从SSD流式加载专家权重，避免全部载入内存。

🥈 Qwen3.5-397B-A17B开源发布

阅读原文 — Hugging Face · 近期

阿里巴巴开源的Qwen3.5-397B-A17B模型，采用混合专家(MoE)架构，每token仅激活部分专家参数。通过2-bit量化技术，可将模型从209GB压缩至120GB，同时保持高质量输出。

🥉 AI辅助研究新范式

阅读原文 — GitHub · 近期

Dan Woods使用Claude Code和Andrej Karpathy的autoresearch模式，让AI运行90次实验并生成MLX Objective-C和Metal代码，最终输出包含完整技术细节的PDF论文。

阅读原文 — simonwillison.net · 11小时前 · ⭐ 高

利用苹果的内存优化技术，实现大模型在消费级设备上的高效运行。通过专家权重按需加载，突破内存限制。

关键词: LLM, MoE, 本地AI, Apple, Qwen

阅读原文 — arXiv · 近期

苹果研究团队提出的高效大语言模型推理方法，通过将模型参数存储在闪存中并按需加载到DRAM，解决了内存受限设备的LLM运行难题。

关键词: 模型压缩, 量化, 闪存优化

阅读原文 — GitHub · 近期

展示AI辅助研究的新可能：使用Claude Code进行90次实验迭代，自动生成包含代码和论文的完整项目。

关键词: AI编程, 自动化研究, Claude

阅读原文 — GitHub · 近期

针对Apple Silicon优化的机器学习框架应用案例，展示如何在M系列芯片上高效运行大规模模型。

关键词: MLX, Apple Silicon, 性能优化

阅读原文 — GitHub · 近期

完整的开源实现，包含MLX Objective-C/Metal代码和自动生成的学术论文，为本地大模型部署提供参考。

关键词: 开源, MoE, 本地部署

💡 本精选由「懂点儿AI」开发维护，关注同名微信公众号获取更多AI实用技巧

数据来源：Karpathy推荐的90+顶级技术博客 RSS聚合生成时间：2026-03-19 08:00 CST