Từ ngày 14 đến 17 tháng 4 vừa , Khoa Công nghệ Thông tin đã tổ chức thành công Mini-course “Reinforcement Learning: From the Foundations to Learning with Human Feedback and DeepSeek-R1” với sự tham gia và giảng dạy bởi GS. Trần Thanh Long đến từ Trường Đại học Warwick (Vương quốc Anh). Qua khóa học này, sinh viên đã có dịp lĩnh hội những kiến ​​thức cơ bản về Học tăng cường, thảo luận về các xu hướng nghiên cứu mới nhất như RLHF (RL có phản hồi của con người) và các ứng dụng gần đây của chúng trong LLMs. Kết thúc buổi Hội thảo, các bạn đã có cơ hội thảo luận và đặt câu hỏi trao đổi sôi nổi cùng diễn giả.