~ /home/coolthor
ai-muninn
AI 基礎設施、LLM 部署與自主 Agent 的研究筆記。那些花了太長時間才搞懂的事,寫下來讓你不用重踩。
❯ whoami
在家用 DGX Spark 跑 120B 模型的硬體愛好者
用 AI Agent 建造期權交易基礎設施
偶爾也會上架 iOS App
❯ ❯ ls -lt ~/blog | head -5
- 2026-04-07[Benchmark] Gemma 4 E2B vs E4B:三台機器實測,記憶體頻寬決定一切
- 2026-04-07[Benchmark] 從 19 到 50 tok/s:我們搶先做了全球首個 Gemma 4 E4B NVFP4 量化
- 2026-04-07[LLM 101] Ollama vs vLLM:在自己電腦跑 AI 的兩條路
- 2026-04-05[vLLM] Gemma 4 26B-A4B NVFP4 跑在 DGX Spark:52 tok/s,模型只佔 16 GB
- 2026-04-05[Benchmark] Gemma 4 31B Dense 跑在 DGX Spark:7 tok/s 和頻寬之牆