VAIS – Thông tin doanh nghiệp - The first knowledge sharing application in Vietnam

CNTT

Công ty Hệ thống Trí thông minh Nhân tạo Việt Nam (VAIS) là công ty AI dẫn đầu công nghệ chuyển giọng nói thành văn bản (Speech-to-Text)

I. TỔNG QUAN

Năm 2018, sau khi xem xét công nghệ nhận dạng giọng nói tiếng Việt hiện có trên thị trường, VAIS đã nhận thấy những sản phẩm lúc đó còn có nhiều hạn chế và chưa xử lý hiệu quả các vấn đề khi ứng dụng vào thực tế, còn các hệ thống tùy chỉnh lại làm mất khá nhiều thời gian để triển khai và yêu cầu nhiều dịch vụ để duy trì và cải thiện.

Từ đó, VAIS thấy cần một công nghệ lõi khác biệt và cần một công ty mới với cách triển khai và tầm nhìn khác biệt – Đó là động lực để thành lập Công ty TNHH Hệ thống Trí thông minh Nhân tạo Việt Nam.

Dẫn đầu cuộc cách mạng Xử lý & Nhận dạng Tiếng nói Tiếng Việt ở Việt Nam – VAIS sáng tạo ra các giải pháp nhằm để thay đổi cách các tổ chức vận hành công việc của họ bằng cách tận dụng trí thông minh nhân tạo. Hiện nay, các giải pháp của VAIS còn được triển khai tại các cơ quan của Nhà nước Việt Nam để giải quyết những vấn đề cơ bản đã kéo dài hàng thập kỷ trước.

Chất Lượng – Tốc Độ – Tối Ưu: VAIS xây dựng các sản phẩm làm cho công việc của nhiều người trở nên hiệu quả hơn, và quan trọng là thú vị hơn.
Độ Chính xác 95%: Tối ưu nhận dạng vùng miền với khả năng hoạt động hiệu quả trong môi trường nhiễu, khoảng cách xa và hiển thị thời gian thực.

Chuẩn hóa Văn bản: Văn bản đầu ra được chuẩn hóa viết tắt, số, ngày tháng, từ nước ngoài, email và tự động viết hoa và chèn dấu chấm câu.
Khả năng Tối ưu: Công nghệ đã được chứng minh có thể được triển khai ngay, thích nghi với mọi ngôn ngữ lập trình và nhiều loại thiết bị (máy tính, điện thoại di động, míc) trong điều kiện ngoại tuyến.
Công nghệ lõi nhận dạng giọng nói: 3 năm nghiên cứu chuyên sâu về công nghệ nhận dạng giọng nói bởi Giám đốc Công nghệ của VAIS – Tiến sĩ Đỗ Quốc Trường.

NGUYÊN TẮC CỦA VAIS:

TẬP TRUNG
- Tập trung vào một mục tiêu duy nhất cho tới khi đạt được thành công.
- Tập trung vào khách hàng, nỗ lực hết mình để mang đến niềm tin cho khách hàng.
- Tập trung vào cuộc “cách mạng” công nghệ nhận dạng giọng nói tiếng Việt, xây dựng sản phẩm với mục đích rõ ràng.
ĐỘT PHÁ
- Chúng tôi luôn làm việc hiệu quả và nhanh chóng.
- Chúng tôi hiểu rằng cái giá phải trả cho sự thiếu quyết đoán cao hơn so với một quyết định sai lầm.
- Chúng tôi chú trọng vào việc đưa ra quyết định và thực thi với tốc độ nhanh, đồng thời tập trung vào các tiêu chuẩn cao nhất.
NHIỆT HUYẾT
- Chúng tôi sở hữu nguồn năng lượng trẻ dồi dào cùng khao khát được cống hiến và niềm đam mê bất tận.
- Chúng tôi yêu công việc của mình, sẵn sàng đương đầu và vượt qua mọi thử thách.
KHÁC BIỆT
- Luôn tìm ra điểm cốt lõi của vấn đề.
- Giải quyết chúng bằng cách tạo ra những giải pháp hoàn thiện.
- Giải pháp của chúng tôi là nền tảng để cộng đồng giải quyết được những “bài toán” của họ.
DÂN CHỦ: Chúng tôi làm việc dựa trên tinh thần cởi mở, mỗi người đều có thể nêu quan điểm của riêng mình và có quyền tự do tiếp cận, sở hữu và giải quyết các vấn đề một cách sáng tạo cùng nhau.
CHINH PHỤC
- Chúng tôi đối mặt với thử thách bằng tính cách mạnh mẽ và tinh thần bất khuất.
- Luôn đồng lòng vượt qua mọi thử thách.

II. THÀNH VIÊN SÁNG LẬP:

Ông Hoàng Minh Thành – Giám đốc Điều hành
- 8 năm kinh nghiệm trong ngành thương mại điện tử, truyền thông, quảng cáo sử dụng công nghệ học máy
- Quản lý cấp cao tại RTB House, Insider Vietnam và TOPICA, Native Indonesia
- Thành lập và phát triển các công ty khởi nghiệp như Kratus Agency, Fresh Deli và Tailor Bros
TS. Đỗ Quốc Trường – Giám đốc Công nghệ
- Nhận bằng tiến sĩ Khoa học máy tính tại đại học Nara Institute of Science and Technology, Nhật Bản
- Từ năm 2014 – 2019, công bố 14 đề tài nghiên cứu về xử lý ngôn ngữ tự nhiên, xử lý tiếng nói như nhận dạng giọng nói, hệ thống dịch giọng nói, trích xuất thông tin từ giọng nói
PGS. TS. Lương Chi Mai – Cố vấn Học thuật
- 30 năm kinh nghiệm trong lĩnh vực xử lý nhận dạng văn bản và âm thanh
- Phó viện trưởng viện công nghệ thông tin và truyền thông, đại học Việt Pháp
- Nhận Giải thưởng Kovalevskaya năm 2010
TS. Nguyễn Thế Lộc – Giám đốc Phần mềm
- Nhận bằng tiến sĩ về Semantic and Web Ontology, Information Extraction tại đại học Montpellier, Pháp
- 13 năm kinh nghiệm đào tạo, giảng dạy công nghệ thông tin
- Phó phòng đào tạo Đại học Mỏ địa chất
- Công bố hơn 6 bài báo trên các tạp chí trong nước và quốc tế về lập trình Web và Cơ sở dữ liệu

III. TIỀM NĂNG THỊ TRƯỜNG:

Công nghệ nhận dạng tiếng nói chuyển thành chữ viết đã được thế giới nghiên cứu từ lâu. Đối với ngôn ngữ tiếng Anh, việc nhận dạng có thể đạt độ chính xác tới 99%. Những trợ lý ảo như Google Assistant, Amazon Alexa hay Apple Siri đã cho thấy khẩu lệnh tiếng Anh được nhận biết tốt như thế nào. Đối với tiếng Việt, một số nghiên cứu để chuyển đổi giọng nói thành văn bản đã được thực hiện từ cách đây nhiều năm nhưng đều chưa đem lại thành công đáng kể, ngoại trừ sản phẩm mới trình làng của VAIS – Công ty TNHH Trí thông minh Nhân tạo Việt Nam. Sản phẩm này vừa được thử nghiệm tại một số phiên chất vấn của Quốc hội và được đánh giá rất cao.

Thị trường trong nước với gần 100 triệu dân, khoảng 700.000 doanh nghiệp, 126 triệu thuê bao di động, tỷ lệ người sử dụng Internet đạt 68,7% (năm 2019) là dư địa rộng lớn để Thành và đội ngũ VAIS khai thác, phát huy những ưu điểm của nền tảng công nghệ speech to text. Bên cạnh đó, khối cơ quan nhà nước, gồm các bộ, ngành và 63 tỉnh, thành phố trên toàn quốc cũng là đối tượng khách hàng rất tiềm năng.

Đặc biệt, VAIS đã triển khai thử nghiệm thành công hệ thống chuyển đổi giọng nói sang văn bản tại Kỳ họp thứ 7, Quốc hội khóa XIV và hỗ trợ gỡ băng trực tiếp cho các phóng viên tác nghiệp tại Kỳ họp thứ 8. VAIS đang tiếp tục hỗ trợ gần 300 phóng viên của hơn 50 cơ quan báo chí trong việc chuyển đổi giọng nói sang văn bản, giúp tiết kiệm thời gian soạn thảo văn bản mà không cần phải gõ bàn phím.

IV. DỊCH VỤ

VAIS xây dựng công nghệ trí tuệ nhân tạo để giải quyết các vấn đề cơ bản đã tồn tại trong nhiều thập kỷ và đưa ra một giải pháp hoàn chỉnh với cách tiếp cận để xây dựng sản phẩm được dựa trên quan điểm: “con người điều khiển, máy móc hỗ trợ”.

Công nghệ lõi nhận dạng giọng nói: Tích hợp công nghệ lõi ASR vào các giải pháp hiện có như trợ lý ảo, IVR và ChatBot.

1. Ưu điểm:

Độ chính xác đến 95%
Hoạt động tốt trong môi trường nhiễu
Bao gồm gần 7000 từ vựng tiếng Việt
Hiển thị kết quả thời gian thực với độ trễ dưới 0,5 giây
Tối ưu nhận dạng giọng nói 3 miền: Bắc, Trung, Nam
Nhận dạng từ khoảng cách xa trong vòng 5 mét
Chuẩn hóa văn bản đầu ra: tên, ngày, tháng, số…
Hỗ trợ nhận dạng nhiều loại audio

2. Phương pháp tích hợp:

ĐA NỀN TẢNG
- Dịch vụ CLoud và Máy chủ riêng
- Điện thoại (IOS/ Android)
- Các loại thiết bị (máy tính, míc, thiết bị đeo thông minh)
- Trực tuyến – Ngoại tuyến

THƯ VIỆN MỞ
- Triển khai linh hoạt với bên thứ 3 thông qua thư viện API, thích ứng với mọi ngôn ngữ lập trình như Python, C +, C#, Objective-C, Java,…

ỨNG DỤNG THỰC TẾ
- Thiết bị IoT
- Thiết bị IoT như loa, míc, đồng hồ đều đang được sử dụng
  
  để điều khiển bằng giọng nói

3. Giải pháp chuyển đổi ORIGIN NOTE:

Khả năng chuyển đổi giọng nói đã được hoàn thiện, từ phần cứng đến API dựa trên dịch vụ Cloud hay đến cả các loại thiết bị kết hợp. Phần mềm chuyển giọng nói thành văn bản giúp giảm đi 10 lần thời lượng chuyển đổi với chi phí hợp lý và sử dụng được ngay sau khi đăng ký thông qua Dịch vụ Cloud.

NỀN TẢNG WEB
- Xuất biên bản họp dưới dạng .docx hoặc .pdf
- Thanh toán theo lưu lượng sử dụng
- Chỉnh sửa/ hiệu chỉnh trực tuyến
- Sử dụng sản phẩm ngay sau khi đăng ký trên trình duyệt Chrome, FireFox, IE

NỀN TẢNG MOBILE
- Biến smartphone thành thiết bị chuyển đổi giọng nói
- Chuyển đổi đoạn ghi âm sang văn bản
- Hoạt động ở mọi nơi, chỉ cần có kết nối Internet
- Hỗ trợ đa nền tảng cả iOS và Android

V. THÀNH TỰU

Giải Nhất cuộc thi Xử lý ngôn ngữ và giọng nói tiếng Việt với độ chính xác đạt 93.6%
Chứng nhận Doanh nghiệp Khoa học và Công nghệ
Giải Nhất hạng mục Nhận dạng giọng nói với độ chính xác 95.2% tại cuộc thi Xử lý ngôn ngữ và giọng nói tiếng Việt 2019
Thư khen của Tổng Thư ký Quốc Hội sau khi triển khai thử nghiệm thành công Giải pháp chuyển đổi giọng nói thành văn bản tại kỳ họp thứ 7, Quốc Hội khóa XIV năm 2019
Giải pháp tiêu biểu Chuyển đổi số Việt Nam 2019 cho phần mềm tự động Chuyển đổi giọng nói tiếng Việt thành văn bản
Vào ngày 19 tháng 7 năm 2019 , thời sự VTV đưa tin về phần mềm Nhận dạng giọng nói tiếng Việt được ứng dụng trí thông minh nhân tạo. Phần mềm được Tổng Thư ký Quốc Hội khen ngợi.
Doanh nghiệp khoa học công nghệ Hệ thống trí thông minh nhân tạo Việt Nam (VAIS) là một trong 2 đơn vị được lựa chọn tham gia Lễ ra mắt Nền tảng công nghệ số do Bộ Thông tin và Truyền thông tổ chức vào năm 2020. Lễ ra mắt này nằm trong chuỗi sự kiện giới thiệu các nền tảng số Make in Vietnam thực hiện Chương trình Chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030 vừa được Thủ tướng Chính phủ phê duyệt

THÔNG TIN DOANH NGHIỆP:

NĂM THÀNH LẬP/ YEAR: 2018

CEO/ FOUNDER: HOÀNG MINH THÀNH

NGÀNH NGHỀ HOẠT ĐỘNG: CÔNG NGHỆ

Địa chỉ: 60B Nguyễn Huy Tưởng, Thanh Xuân, Hà Nội

Tel: +84 92 799 9680

Email: [email protected]