夜轻歌JJ

不要给自己压力,只做确定性高的交易 🐳

    • 夜轻歌JJ夜轻歌JJ
      ·01-26
      wow

      The global DeepSeek reappearance frenzy! The myth of Silicon Valley giants collapses, 30 knives witness the aha moment

      就在这当口,全球复现DeepSeek的一波狂潮也来了。更令人兴奋的是,成本不到30美金,就可以亲眼见证「啊哈」时刻。7B模型复刻,结果令人惊讶港科大助理教授何俊贤的团队,只用了8K个样本,就在7B模型上复刻出了DeepSeek-R1-Zero和DeepSeek-R1的训练。与DeepSeek R1类似,研究者的强化学习方案极其简单,没有使用奖励模型或MCTS类技术。随后,生成长度开始再次增加,此时出现了自我反思机制。
      The global DeepSeek reappearance frenzy! The myth of Silicon Valley giants collapses, 30 knives witness the aha moment
      664Comment
      Report
       
       
       
       

      Most Discussed