ai產品經理面試高頻100題
強化學習在自然語言處理下的應用篇 PDF 下載
大模型(LLMs)強化學習——RLHF及其變種面
大模型(LLMs)強化學習—— PPO 面
大模型(LLMs)強化學習面
大模型(LLMs)評測面
基于lora的llama2二次預訓練
增量預訓練(Pretrain)樣本拼接篇
大模型(LLMs)增量預訓練篇
如何使用 PEFT庫 中 LoRA?