Ngày mai, 26/11/2022 sẽ diễn ra Hội thảo lần thứ 9 về Xử lý ngôn ngữ và tiếng nói tiếng Việt - VLSP 2022 do Viện Nghiên cứu Cao cấp về Toán (VIASM) đăng cai. Các đơn vị đồng tổ chức gồm Trường Đại học Khoa học Tự nhiên và Trường Đại học Công nghệ - ĐHQG Hà Nội; Trường Đại học Công nghệ Thông tin - ĐHQG TP.HCM; Trung tâm từ điển Vietlex, Trường Đại học Bách khoa Hà Nội; Trường Đại học Thuỷ lợi; Trường Đại học Việt Pháp và Viện Công nghệ Thông tin - Viện Hàn lâm Khoa học và Công nghệ Việt Nam.

VLSP là hội thảo thường niên về xử lý ngôn ngữ và tiếng nói tiếng Việt do Câu lạc bộ VLSP, Hội Tin học Việt Nam tổ chức. Diễn đàn VLSP là nơi quy tụ các nhà nghiên cứu và chuyên gia làm việc trong lĩnh vực nghiên cứu về xử lý tiếng nói và ngôn ngữ tiếng Việt.

Trong những năm gần đây, chuỗi hội thảo VLSP đã có những đóng góp rất tích cực cho cộng đồng thông qua việc cung cấp các bộ dữ liệu có chú giải miễn phí dùng trong nghiên cứu; tổ chức các cuộc thi cho các nhóm nghiên cứu NLP có được đánh giá khách quan về chất lượng các công cụ giải quyết các tác vụ khác nhau trong lĩnh vực NLP, qua đó cộng đồng nghiên cứu cũng được chia sẻ các tiến bộ khoa học công nghệ nhờ các báo cáo khoa học của các đội thi xuất sắc nhất tại hội thảo.

VLSP 2022 tổ chức 7 cuộc thi về xử lý tiếng nói và xử lý văn bản, bao gồm: tổng hợp tiếng nói, nhận dạng tiếng nói, xác minh người nói, phân tích cú pháp thành phần, tóm tắt đa văn bản, dịch máy Trung - Việt, hỏi đáp đa ngữ về nội dung ảnh.

Nhận dạng tiếng nói tiếng Việt (Vietnamese Automatic Speech Recognition - VietASR) là một trong những bài toán quan trọng nhất của xử lý tiếng nói. Chủ đề của cuộc thi năm nay tập trung vào nhận dạng các bài giảng trực tuyến. Trong gần 3 năm đại dịch vừa qua, chúng ta có một kho khổng lồ các video bài giảng trực tuyến. Do đó, nhu cầu tự động phân loại, đánh chỉ mục, tìm kiếm nội dung kho bài giảng là rất lớn. Sử dụng công nghệ nhận dạng tiếng nói với độ chính xác cao để chuyển những video đó ra văn bản có thể giải quyết được nhu cầu trên.

Các hoạt động của VLSP vì sự phát triển của cộng đồng nghiên cứu và phát triển VLSP ở Việt Nam đều dựa vào đóng góp tự nguyện của các nhóm nghiên cứu thuộc các trường viện trên khắp cả nước và từ nguồn tài trợ của nhiều doanh nghiệp. Trong đó, đặc biệt phải kể đến những đơn vị tài trợ thường niên như Aimesoft, Dagoras, VBee, Int2.