Phần mềm chuyển giọng nói thành văn bản của VAIS có gì đặc biệt?
Bộ trưởng Công an Tô Lâm cùng Bộ trưởng Thông tin và Truyền thông Nguyễn Mạnh Hùng trao giải Nhất cho nhóm tác giả.
Phần mềm tự động chuyển đổi tiếng nói tiếng Việt sang văn bản, gọi tắt là Origin-STT của nhóm tác giả đến từ công ty Công ty TNHH Hệ thống trí thông minh nhân tạo Việt Nam (VAIS) đã giành giải Nhất trong hệ thống sản phẩm CNTT, giải thưởng Nhân tài đất Việt 2019.
Phần mềm tự động chuyển đổi tiếng nói tiếng Việt sang văn bản (Origin-STT) là phần mềm hỗ trợ chuyển từ giọng nói thành văn bản, và gỡ băng với độ chính xác trung bình lên tới 93,6%.
Không những được đánh giá cao ở tính chính xác, nhận dạng tốt ở khoảng cách 2m cho độ chính xác lên đến 98% và từ 3-5m độ chính xác còn 95%, Origin còn có thể nhận dạng giọng nói ở cả 3 miền Bắc, Trung, Nam. Với khả năng nhận dạng khoảng 7.000 từ tiếng Việt, Origin-STT thực sự là phần mềm giúp tiết kiệm thời gian, công sức tối đa.
Cụ thể, Origin-STT tiết kiệm tối thiểu 10 lần thời gian, công sức nghe lại audio và gõ lại văn bản (gỡ băng) sau các phiên họp của hàng vạn cuộc họp trong cả nước trong một năm, trong đó có kỳ họp thứ 8 Quốc hội khóa XIV đang diễn ra.
Công nghệ nhận dạng tiếng nói chuyển thành chữ viết đã được thế giới nghiên cứu từ lâu. Đối với ngôn ngữ tiếng Anh, việc nhận dạng có thể đạt độ chính xác tới 99%. Những trợ lý ảo như Google Assistant, Amazon Alexa hay Apple Siri đã cho thấy khẩu lệnh tiếng Anh được nhận biết tốt như thế nào.
Đối với tiếng Việt, một số nghiên cứu để chuyển đổi giọng nói thành văn bản đã được thực hiện từ cách đây nhiều năm nhưng đều chưa đem lại thành công đáng kể, ngoại trừ sản phẩm mới trình làng của VAIS – Công ty TNHH Trí thông minh Nhân tạo Việt Nam. Sản phẩm này vừa được thử nghiệm tại một số phiên chất vấn của Quốc hội và được đánh giá rất cao.
Anh Đỗ Quốc Trình – đồng sáng lập VAIS kiêm Giám đốc Marketing sản phẩm cho biết, tốc độ nhận dạng của phần mềm này là 0,5 giây, gần như một tốc độ tức thời.
Phần mềm VAIS vừa được chạy thử nghiệm tại một số phiên chất vấn trong kỳ họp Quốc hội vừa qua. Trước đây, khi không có phần mềm, Chủ tịch Quốc hội sẽ dùng giấy bút ghi chú đại biểu nào nêu câu hỏi chất vấn gì, Bộ trưởng nào trả lời, nội dung khái quát ra sao.
Khi áp dụng phần mềm của VAIS, tất cả các câu hỏi và phần trả lời, cũng như tên đại biểu được hiển thị ngay trên chiếc máy tính bảng đặt phía trước Chủ tịch Quốc hội Nguyễn Thị Kim Ngân, giúp bà dễ dàng theo dõi mà không cần giấy bút ghi chú.
Thông thường mỗi phiên chất vấn, Ban thư ký gồm khoảng 30 người sẽ phải gõ lại nội dung cuộc họp, và nếu cuộc họp buổi sáng thì phải đến chiều mới có phần nội dung gõ lại bằng chữ. Nhưng khi áp dụng phần mềm của VAIS, chỉ khoảng 60 phút sau là toàn bộ nội dung phiên họp đã được ghi lại thành 1 file văn bản.
Ngoài Origin-STT, hai giải Nhì của lĩnh vực CNTT, giải thưởng Nhân tài đất Việt năm nay thuộc về Giải pháp bảo mật toàn diện cho hệ thống camera an ninh của nhóm tác giả Viện Công nghệ Thông tin và Truyền thông, Đại học Bách khoa Hà Nội; Đài Truyền hình 4.0 – Gostudio của nhóm tác giả Công ty Cổ phần Công nghệ GoStream.
Ngoài ra, lĩnh vực CNTT còn có bốn giải ba và bốn giải khuyến khích.
Với chủ đề “Sức mạnh Công nghệ Số”, năm nay, giải thưởng Nhân tài đất Việt, lĩnh vực CNTT đã có tổng cộng 418 sản phẩm dự thi với ba hệ thống: Sản phẩm CNTT Kết nối – Di động; Sản phẩm CNTT Khởi nghiệp; Sản phẩm Số triển vọng.
Origin-STT là phần mềm hỗ trợ chuyển từ giọng nói thành văn bản và gỡ băng với độ chính xác trung bình lên tới 93,6%.
Được đánh giá cao ở tính chính xác, nhận dạng tốt ở khoảng cách xa (khoảng cách 2m cho độ chính xác lên đến 98% và từ 3-5m độ chính xác còn 95%), Origin còn có thể nhận dạng giọng nói ở cả 3 miền Bắc, Trung, Nam. Có khả năng nhận dạng khoảng 7.000 từ tiếng Việt, Origin-STT thực sự là phần mềm giúp tiết kiệm thời gian, công sức tối đa.
Origin-STT tiết kiệm tối thiểu 10 lần thời gian, công sức nghe lại audio và gõ lại văn bản (gỡ băng) sau các phiên họp của hàng vạn cuộc họp trong cả nước trong một năm.”
Nguyễn Tuân