VAIS – Thông tin doanh nghiệp
AI
CNTT
Công ty Hệ thống Trí thông minh Nhân tạo Việt Nam (VAIS) là công ty AI dẫn đầu công nghệ chuyển giọng nói thành văn bản (Speech-to-Text)
I. TỔNG QUAN
Năm 2018, sau khi xem xét công nghệ nhận dạng giọng nói tiếng Việt hiện có trên thị trường, VAIS đã nhận thấy những sản phẩm lúc đó còn có nhiều hạn chế và chưa xử lý hiệu quả các vấn đề khi ứng dụng vào thực tế, còn các hệ thống tùy chỉnh lại làm mất khá nhiều thời gian để triển khai và yêu cầu nhiều dịch vụ để duy trì và cải thiện.
Từ đó, VAIS thấy cần một công nghệ lõi khác biệt và cần một công ty mới với cách triển khai và tầm nhìn khác biệt – Đó là động lực để thành lập Công ty TNHH Hệ thống Trí thông minh Nhân tạo Việt Nam.
Dẫn đầu cuộc cách mạng Xử lý & Nhận dạng Tiếng nói Tiếng Việt ở Việt Nam – VAIS sáng tạo ra các giải pháp nhằm để thay đổi cách các tổ chức vận hành công việc của họ bằng cách tận dụng trí thông minh nhân tạo. Hiện nay, các giải pháp của VAIS còn được triển khai tại các cơ quan của Nhà nước Việt Nam để giải quyết những vấn đề cơ bản đã kéo dài hàng thập kỷ trước.
-
Chất Lượng – Tốc Độ – Tối Ưu: VAIS xây dựng các sản phẩm làm cho công việc của nhiều người trở nên hiệu quả hơn, và quan trọng là thú vị hơn.
-
Độ Chính xác 95%: Tối ưu nhận dạng vùng miền với khả năng hoạt động hiệu quả trong môi trường nhiễu, khoảng cách xa và hiển thị thời gian thực.
-
Chuẩn hóa Văn bản: Văn bản đầu ra được chuẩn hóa viết tắt, số, ngày tháng, từ nước ngoài, email và tự động viết hoa và chèn dấu chấm câu.
-
Khả năng Tối ưu: Công nghệ đã được chứng minh có thể được triển khai ngay, thích nghi với mọi ngôn ngữ lập trình và nhiều loại thiết bị (máy tính, điện thoại di động, míc) trong điều kiện ngoại tuyến.
-
Công nghệ lõi nhận dạng giọng nói: 3 năm nghiên cứu chuyên sâu về công nghệ nhận dạng giọng nói bởi Giám đốc Công nghệ của VAIS – Tiến sĩ Đỗ Quốc Trường.
NGUYÊN TẮC CỦA VAIS:
-
TẬP TRUNG
-
Tập trung vào một mục tiêu duy nhất cho tới khi đạt được thành công.
-
Tập trung vào khách hàng, nỗ lực hết mình để mang đến niềm tin cho khách hàng.
-
Tập trung vào cuộc “cách mạng” công nghệ nhận dạng giọng nói tiếng Việt, xây dựng sản phẩm với mục đích rõ ràng.
-
-
ĐỘT PHÁ
-
Chúng tôi luôn làm việc hiệu quả và nhanh chóng.
-
Chúng tôi hiểu rằng cái giá phải trả cho sự thiếu quyết đoán cao hơn so với một quyết định sai lầm.
-
Chúng tôi chú trọng vào việc đưa ra quyết định và thực thi với tốc độ nhanh, đồng thời tập trung vào các tiêu chuẩn cao nhất.
-
-
NHIỆT HUYẾT
-
Chúng tôi sở hữu nguồn năng lượng trẻ dồi dào cùng khao khát được cống hiến và niềm đam mê bất tận.
-
Chúng tôi yêu công việc của mình, sẵn sàng đương đầu và vượt qua mọi thử thách.
-
-
KHÁC BIỆT
-
Luôn tìm ra điểm cốt lõi của vấn đề.
-
Giải quyết chúng bằng cách tạo ra những giải pháp hoàn thiện.
-
Giải pháp của chúng tôi là nền tảng để cộng đồng giải quyết được những “bài toán” của họ.
-
-
DÂN CHỦ: Chúng tôi làm việc dựa trên tinh thần cởi mở, mỗi người đều có thể nêu quan điểm của riêng mình và có quyền tự do tiếp cận, sở hữu và giải quyết các vấn đề một cách sáng tạo cùng nhau.
-
CHINH PHỤC
-
Chúng tôi đối mặt với thử thách bằng tính cách mạnh mẽ và tinh thần bất khuất.
-
Luôn đồng lòng vượt qua mọi thử thách.
-
II. THÀNH VIÊN SÁNG LẬP:
-
Ông Hoàng Minh Thành – Giám đốc Điều hành
-
8 năm kinh nghiệm trong ngành thương mại điện tử, truyền thông, quảng cáo sử dụng công nghệ học máy
-
Quản lý cấp cao tại RTB House, Insider Vietnam và TOPICA, Native Indonesia
-
Thành lập và phát triển các công ty khởi nghiệp như Kratus Agency, Fresh Deli và Tailor Bros
-
-
TS. Đỗ Quốc Trường – Giám đốc Công nghệ
-
Nhận bằng tiến sĩ Khoa học máy tính tại đại học Nara Institute of Science and Technology, Nhật Bản
-
Từ năm 2014 – 2019, công bố 14 đề tài nghiên cứu về xử lý ngôn ngữ tự nhiên, xử lý tiếng nói như nhận dạng giọng nói, hệ thống dịch giọng nói, trích xuất thông tin từ giọng nói
-
-
PGS. TS. Lương Chi Mai – Cố vấn Học thuật
-
30 năm kinh nghiệm trong lĩnh vực xử lý nhận dạng văn bản và âm thanh
-
Phó viện trưởng viện công nghệ thông tin và truyền thông, đại học Việt Pháp
-
Nhận Giải thưởng Kovalevskaya năm 2010
-
-
TS. Nguyễn Thế Lộc – Giám đốc Phần mềm
-
Nhận bằng tiến sĩ về Semantic and Web Ontology, Information Extraction tại đại học Montpellier, Pháp
-
13 năm kinh nghiệm đào tạo, giảng dạy công nghệ thông tin
-
Phó phòng đào tạo Đại học Mỏ địa chất
-
Công bố hơn 6 bài báo trên các tạp chí trong nước và quốc tế về lập trình Web và Cơ sở dữ liệu
-
III. TIỀM NĂNG THỊ TRƯỜNG:
Công nghệ nhận dạng tiếng nói chuyển thành chữ viết đã được thế giới nghiên cứu từ lâu. Đối với ngôn ngữ tiếng Anh, việc nhận dạng có thể đạt độ chính xác tới 99%. Những trợ lý ảo như Google Assistant, Amazon Alexa hay Apple Siri đã cho thấy khẩu lệnh tiếng Anh được nhận biết tốt như thế nào. Đối với tiếng Việt, một số nghiên cứu để chuyển đổi giọng nói thành văn bản đã được thực hiện từ cách đây nhiều năm nhưng đều chưa đem lại thành công đáng kể, ngoại trừ sản phẩm mới trình làng của VAIS – Công ty TNHH Trí thông minh Nhân tạo Việt Nam. Sản phẩm này vừa được thử nghiệm tại một số phiên chất vấn của Quốc hội và được đánh giá rất cao.
Thị trường trong nước với gần 100 triệu dân, khoảng 700.000 doanh nghiệp, 126 triệu thuê bao di động, tỷ lệ người sử dụng Internet đạt 68,7% (năm 2019) là dư địa rộng lớn để Thành và đội ngũ VAIS khai thác, phát huy những ưu điểm của nền tảng công nghệ speech to text. Bên cạnh đó, khối cơ quan nhà nước, gồm các bộ, ngành và 63 tỉnh, thành phố trên toàn quốc cũng là đối tượng khách hàng rất tiềm năng.
Đặc biệt, VAIS đã triển khai thử nghiệm thành công hệ thống chuyển đổi giọng nói sang văn bản tại Kỳ họp thứ 7, Quốc hội khóa XIV và hỗ trợ gỡ băng trực tiếp cho các phóng viên tác nghiệp tại Kỳ họp thứ 8. VAIS đang tiếp tục hỗ trợ gần 300 phóng viên của hơn 50 cơ quan báo chí trong việc chuyển đổi giọng nói sang văn bản, giúp tiết kiệm thời gian soạn thảo văn bản mà không cần phải gõ bàn phím.
IV. DỊCH VỤ
VAIS xây dựng công nghệ trí tuệ nhân tạo để giải quyết các vấn đề cơ bản đã tồn tại trong nhiều thập kỷ và đưa ra một giải pháp hoàn chỉnh với cách tiếp cận để xây dựng sản phẩm được dựa trên quan điểm: “con người điều khiển, máy móc hỗ trợ”.
Công nghệ lõi nhận dạng giọng nói: Tích hợp công nghệ lõi ASR vào các giải pháp hiện có như trợ lý ảo, IVR và ChatBot.
1. Ưu điểm:
-
Độ chính xác đến 95%
-
Hoạt động tốt trong môi trường nhiễu
-
Bao gồm gần 7000 từ vựng tiếng Việt
-
Hiển thị kết quả thời gian thực với độ trễ dưới 0,5 giây
-
Tối ưu nhận dạng giọng nói 3 miền: Bắc, Trung, Nam
-
Nhận dạng từ khoảng cách xa trong vòng 5 mét
-
Chuẩn hóa văn bản đầu ra: tên, ngày, tháng, số…
-
Hỗ trợ nhận dạng nhiều loại audio
2. Phương pháp tích hợp:
-
ĐA NỀN TẢNG
-
Dịch vụ CLoud và Máy chủ riêng
-
Điện thoại (IOS/ Android)
-
Các loại thiết bị (máy tính, míc, thiết bị đeo thông minh)
-
Trực tuyến – Ngoại tuyến
-
-
THƯ VIỆN MỞ
-
Triển khai linh hoạt với bên thứ 3 thông qua thư viện API, thích ứng với mọi ngôn ngữ lập trình như Python, C +, C#, Objective-C, Java,…
-
-
ỨNG DỤNG THỰC TẾ
-
Thiết bị IoT
-
Thiết bị IoT như loa, míc, đồng hồ đều đang được sử dụng
để điều khiển bằng giọng nói
-
3. Giải pháp chuyển đổi ORIGIN NOTE:
Khả năng chuyển đổi giọng nói đã được hoàn thiện, từ phần cứng đến API dựa trên dịch vụ Cloud hay đến cả các loại thiết bị kết hợp. Phần mềm chuyển giọng nói thành văn bản giúp giảm đi 10 lần thời lượng chuyển đổi với chi phí hợp lý và sử dụng được ngay sau khi đăng ký thông qua Dịch vụ Cloud.
-
NỀN TẢNG WEB
-
Xuất biên bản họp dưới dạng .docx hoặc .pdf
-
Thanh toán theo lưu lượng sử dụng
-
Chỉnh sửa/ hiệu chỉnh trực tuyến
-
Sử dụng sản phẩm ngay sau khi đăng ký trên trình duyệt Chrome, FireFox, IE
-
-
NỀN TẢNG MOBILE
-
Biến smartphone thành thiết bị chuyển đổi giọng nói
-
Chuyển đổi đoạn ghi âm sang văn bản
-
Hoạt động ở mọi nơi, chỉ cần có kết nối Internet
-
Hỗ trợ đa nền tảng cả iOS và Android
-
V. THÀNH TỰU
-
Giải Nhất cuộc thi Xử lý ngôn ngữ và giọng nói tiếng Việt với độ chính xác đạt 93.6%
-
Chứng nhận Doanh nghiệp Khoa học và Công nghệ
-
Giải Nhất hạng mục Nhận dạng giọng nói với độ chính xác 95.2% tại cuộc thi Xử lý ngôn ngữ và giọng nói tiếng Việt 2019
-
Thư khen của Tổng Thư ký Quốc Hội sau khi triển khai thử nghiệm thành công Giải pháp chuyển đổi giọng nói thành văn bản tại kỳ họp thứ 7, Quốc Hội khóa XIV năm 2019
-
Giải pháp tiêu biểu Chuyển đổi số Việt Nam 2019 cho phần mềm tự động Chuyển đổi giọng nói tiếng Việt thành văn bản
-
Vào ngày 19 tháng 7 năm 2019 , thời sự VTV đưa tin về phần mềm Nhận dạng giọng nói tiếng Việt được ứng dụng trí thông minh nhân tạo. Phần mềm được Tổng Thư ký Quốc Hội khen ngợi.
-
Doanh nghiệp khoa học công nghệ Hệ thống trí thông minh nhân tạo Việt Nam (VAIS) là một trong 2 đơn vị được lựa chọn tham gia Lễ ra mắt Nền tảng công nghệ số do Bộ Thông tin và Truyền thông tổ chức vào năm 2020. Lễ ra mắt này nằm trong chuỗi sự kiện giới thiệu các nền tảng số Make in Vietnam thực hiện Chương trình Chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030 vừa được Thủ tướng Chính phủ phê duyệt
THÔNG TIN DOANH NGHIỆP:
NĂM THÀNH LẬP/ YEAR: 2018
CEO/ FOUNDER: HOÀNG MINH THÀNH
NGÀNH NGHỀ HOẠT ĐỘNG: CÔNG NGHỆ
Địa chỉ: 60B Nguyễn Huy Tưởng, Thanh Xuân, Hà Nội
Tel: +84 92 799 9680
Email: [email protected]