- 24:46
P09 以大型语言模型打造的AI Agent (14_50 教你怎么打造芙莉莲一级魔法使考试中出现的泥人哥列姆) [生成式AI导论 2024 李宏毅]_哔哩哔哩_bilibili
- 01:18:36
OpenAI研究员讲解指令微调和RLHF_哔哩哔哩_bilibili
- 01:00:02
什么是基于人类反馈的强化学习 What is RLHF?_哔哩哔哩_bilibili
- 01:45
【夏色花梨】す、好きなんかじゃない!【SYNTHESIZER V COVER】_哔哩哔哩_bilibili
- 13:38
深度学习12:不发表情不能好好说话之Emoji表情生成器_哔哩哔哩_bilibili
- 13:17
火炉课堂 | 深度学习第二章:机器学习基础_哔哩哔哩_bilibili
- 06:34
19 How LLMs follow instructions- Instruction tuning and RLHF (optional)_哔哩哔哩_bilibili
- 19:01
算法工程师介绍ChatGPT(产品向)第三章-GPT3.5与RLHF_哔哩哔哩_bilibili
- 18:25
清华博后带你走进ChatGPT——ChatGPT与RLHF(3)_哔哩哔哩_bilibili
- 01:00:38
【Huggingface分享】RLHF: ChatGPT是怎样炼成的_哔哩哔哩_bilibili