记录团队成长点滴以及对技术、理念的探索,同时我们乐于分享!

3523
如何评价MiniMax推出的全球首个开源大规模混合架构的推理模型MiniMax-M1,其有何技术优势?

2025-06-17 查看(1000)

虽说如今新大模型发布必须有点拿得出手的干货,但MiniMax
3523
女主播和榜一大哥现实碰面会做什么?

2025-06-17 查看(1000)

抖音刷到38级了,刷了5个女主播,见了4个,3个发生了关系。
3523
核武器真的有宣传中那么牛逼吗?

2025-06-18 查看(1000)

没有。 实际上核弹打击现代城市,特别是国内城市的效果非常差
3523
为什么QQ上的网络状态没有了?

2025-06-18 查看(1000)

现在是2025年,Mac 版新QQ仍然有这个网络在线状态,只
3523
systemd吞并了什么?

2025-06-17 查看(1000)

只吞了init的。 剩下的那些玩意儿,只是套个壳。 比如
3523
qwen3-0.6B这种小模型有什么实际意义和用途吗?

2025-06-17 查看(1000)

0.5b 这种才是最有用的,因为它可以万能地微调成单一小任务