213
/
175224
AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT
ai-dich-thuat-cua-startup-viet-tot-hon-ca-google-chatgpt
news

AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT

Thứ 6, 17/01/2025 | 07:19:00
2,225 lượt xem

Doctranslate.io có thể dịch được hình ảnh, âm thanh, video và hiểu sâu sắc tiếng Việt, nhờ đó kết quả benchmark cũng vượt trội so với ChatGPT, Google Translate.

Doctranslate.io là nền tảng dịch thuật bằng AI (trí tuệ nhân tạo), được sáng lập bởi tiến sĩ Trần Vũ Anh. Startup ra đời năm 2023, được Google chọn tham gia chương trình Google Accelerator for Startups 2024. Mới đây, Doctranslate.io tiếp tục nằm trong top 5 startup tiềm năng nhất tại Ngày hội Khởi nghiệp đổi mới sáng tạo Quốc gia (TECHFEST 2024).

AI dịch tối ưu hơn Google, ChatGPT

Sau nhiều năm sinh sống và làm việc ở nước ngoài, Vũ Anh nhận thấy ngôn ngữ là rào cản lớn để mang tri thức đến gần hơn với người Việt. Trong khi các mô hình ngôn ngữ lớn như Google dịch thuật, ChatGPT làm rất tốt công việc phiên dịch trong giao tiếp, hội thoại, Vũ Anh nhận ra còn một "thị trường ngách" nhiều dư địa mà các ông lớn chưa "với tay" đến là dịch thuật văn bản.

"Nếu bạn có một file tài liệu, bài nghiên cứu khoa học dài 20 trang, bạn có thể đưa vào cho ChatGPT dịch. Nhưng chatbot sẽ chỉ trả về các bản dịch dưới dạng chữ viết. Những phần rất quan trọng như biểu đồ, hình ảnh, bảng dữ liệu… gần như bị mất tất cả định dạng. Nếu phải ngồi sắp xếp, thiết kế lại các bảng biểu đó sẽ vô cùng mất thời gian, công sức, thậm chí có thể xảy ra sai sót. Các mô hình ngôn ngữ lớn của Google, OpenAI dù mạnh nhưng vẫn chưa xử lý được triệt để vấn đề. Đó là lý do Doctranslate.io ra đời, tập trung vào việc dịch văn bản, hình ảnh, âm thanh, video", Vũ Anh nói.

File hình ảnh gốc (trái) và file dịch thuật của Doctranslate.io 

Điểm đặc biệt của nền tảng là người dùng có thể đưa đầu vào là một file văn bản, nhiều định dạng với biểu đồ, hình ảnh. Sau đó AI không chỉ dịch các đoạn văn mà còn dịch cả hình ảnh, giữ nguyên định dạng gốc, giúp người dùng có thể so sánh trực tiếp và dùng ngay, không tốn thêm thời gian để thiết kế lại. Với một file hình ảnh nhiều nội dung, Doctranslate.io thậm chí còn cho phép xuất ra file PowerPoint để người dùng tùy chỉnh từng chi tiết và dùng vào nhiều mục đích khác nhau.

Trong nghiên cứu khoa học được công bố tại hội nghị IEEE-RIVF (International Conference on Computing and Communication Technologies) và IEEE - tổ chức kỹ thuật chuyên nghiệp lớn nhất thế giới), mô hình ALMA-Gemma-7B-IT-ST của Doctranslate.io đã cho điểm vượt trội so với Google Translate, GPT-3.5-Turbo của OpenAI… trong bài kiểm tra dịch thuật từ tiếng Anh sang tiếng Việt.

Cụ thể, trong khi GPT-3.5 Turbo lần lượt được 39,3 điểm và 34,1 điểm cho bài dịch Anh - Việt và ngược lại Việt - Anh, AI của Doctranslate.io vượt trội với 56,21 điểm và 57,32 điểm. Còn Google Translate được 39,86 điểm và 35,76 điểm.

Công thức riêng của startup Việt

Ngoài việc cung cấp những sản phẩm ngách mà các mô hình AI lớn chưa đánh chiếm, một trong những lý do khiến Doctranslate.io vượt trội so với ChatGPT, Google Translate là khả năng hiểu tiếng Việt sâu sắc.

Theo Vũ Anh, tiếng Việt có nhiều đặc trưng so với tiếng Anh và những ngôn ngữ khác. Nếu không nắm rõ, sẽ không thể cải thiện được khả năng dịch thuật của AI. Một trong những ví dụ đơn giản nhất là ngôi thứ. "Chúng ta có rất nhiều danh từ, đại từ nhân xưng để chỉ mối quan hệ và cả sắc thái trong từng ngữ cảnh khác nhau. Ví dụ khi dịch truyện, nói 'ông Chí Phèo' và 'thằng Chí Phèo' là khác nhau rất nhiều. Đây là điều các mô hình AI lớn, nếu không hiểu biết sâu sắc tiếng Việt và không tinh chỉnh sẽ không thể cải thiện được độ chính xác", người sáng lập Doctranslate.io nói.

Giao diện nền tảng dịch thuật Doctranslate.io 

Trong quá trình triển khai, đội ngũ của Vũ Anh cũng nhận thấy nhu cầu dịch thuật về tài liệu trong ngành y tế, văn bản của các công ty đa quốc gia, ngân hàng, dịch nội dung các cuộc họp, dịch truyện… là rất lớn. Tuy nhiên không phải lúc nào các tổ chức này cũng sẵn sàng sử dụng các mô hình ngôn ngữ lớn miễn phí như của Google, OpenAI trong hệ thống. Một số định chế cần những mô hình "offline" để có thể dễ dàng tích hợp vào hệ thống, đem lại hiệu quả công việc tốt nhưng đặc biệt hơn là đảm bảo quyền riêng tư của dữ liệu.

Nắm bắt được nhu cầu đó, Doctranslate.io phát triển cả nền tảng dịch thuật cho người dùng phổ thông lẫn phiên bản được tùy chỉnh để có thể dễ dàng tích hợp vào các hệ thống của doanh nghiệp chuyển đổi số cần riêng tư, bảo mật. Hiện tại người dùng có thể sử dụng bản dùng thử miễn phí của Doctranslate.io để dịch văn bản, hình ảnh, video, cuộc hội thoại. Trong khi đó các doanh nghiệp có thể dùng bản cloud hoặc API của Doctranslate.io. Cao hơn, Doctranslate.io còn cung cấp phiên bản on-premises, có độ tùy biến cao và dữ liệu được xử lý ngay tại hệ thống của công ty.

Sau hơn một năm có mặt trên thị trường, Doctranslate.io đang có hơn 200.000 người dùng hoạt động thường xuyên mỗi tháng và được tích hợp trong nhiều hệ thống của doanh nghiệp. Startup AI của Việt Nam dự định sẽ tiếp tục mở rộng thị trường ra các nước trong khu vực Đông Nam Á, sau đó là toàn cầu. "Với Doctranslate.io, chúng tôi từng bước hiện thực hóa mục tiêu đưa tri thức đến gần hơn với mọi người và khẳng định vị thế của trí tuệ Việt trên bản đồ công nghệ toàn cầu", Trần Vũ Anh chia sẻ.

Theo Khương Nha/ Thanh niên

https://thanhnien.vn/ai-dich-thuat-cua-startup-viet-tot-hon-ca-google-chatgpt-185250115142214607.htm

  • Từ khóa

Intel tiếp tục sa thải 10.000 công nhân trên toàn cầu

Đợt sa thải lớn tiếp theo của Intel sẽ ảnh hưởng trực tiếp đến lao động trong các nhà máy khi tập đoàn muốn cắt giảm thêm 15 - 20% việc làm mà không kèm...
17:40 - 18/06/2025
226 lượt xem

Công nhận tiền số để bảo vệ nhà đầu tư

Việc luật hóa tài sản số mở ra cơ hội phát triển công nghiệp số cũng như nhận diện rủi ro lừa đảo.
15:55 - 18/06/2025
277 lượt xem

iPhone tương lai có thể chụp ảnh nét ngay cả đối tượng di chuyển

Apple vừa công bố một bằng sáng chế mới mang mã số US 12335613 B2 liên quan đến một phương pháp lấy nét tiên tiến cho camera iPhone.
14:58 - 18/06/2025
301 lượt xem

Iran yêu cầu người dân xóa ứng dụng WhatsApp, Telegram

Chính quyền Iran vừa kêu gọi người dân gỡ bỏ ứng dụng nhắn tin WhatsApp, Telegram khỏi điện thoại, với lý do ứng dụng này thu thập thông tin người dùng và...
11:29 - 18/06/2025
392 lượt xem

Rounds công bố đầu tư 20 triệu USD để mua lại ứng dụng của người Việt

Rounds, công ty công nghệ về tối ưu hóa ứng dụng di động vừa chính thức công bố gia nhập thị trường Việt Nam, đồng thời cam kết đầu tư 20 triệu USD vào...
09:48 - 18/06/2025
390 lượt xem