Nội dung sau đây được dịch từ nguồn tiếng Trung bằng máy dịch mà không qua chỉnh sửa hậu kỳ.
Trong bài viết này, chúng tôi sẽ cung cấp hai trường hợp dự án liên quan để minh họa nhu cầu về ngôn ngữ mới của khách hàng trong kỷ nguyên AI và cách TalkingChina Translation phát triển và cung cấp các giải pháp đáp ứng những nhu cầu này. Với sự ra đời của kỷ nguyên trí tuệ nhân tạo, ngày càng nhiều nhu cầu về dịch vụ ngôn ngữ không còn xuất hiện dưới các hình thức truyền thống, điều này đặt ra yêu cầu cao hơn đối với các công ty dịch thuật: chúng ta cần có khả năng cung cấp các dịch vụ tùy chỉnh, tập trung vào nhu cầu của khách hàng, tận dụng nguồn lực dịch giả bản ngữ đa ngôn ngữ toàn cầu phong phú, khả năng cung cấp dịch vụ đa ngôn ngữ, khả năng giao tiếp với khách hàng và phát triển giải pháp cá nhân hóa, cùng khả năng quản lý dự án toàn diện làm năng lực cạnh tranh cốt lõi, để đáp ứng nhu cầu dịch vụ ngôn ngữ mới đa dạng của khách hàng trong quá trình toàn cầu hóa.
Trường hợp 1
Bối cảnh dự án
Khách hàng của chúng tôi là một công ty dịch vụ công nghệ trí tuệ nhân tạo hàng đầu. Bằng cách sử dụng các công nghệ như mô hình ngôn ngữ lớn, xử lý ngôn ngữ tự nhiên (NLP), học máy sâu, điện toán bảo mật và điện toán đám mây, chúng tôi cung cấp dịch vụ thông qua mô hình Dịch vụ Mô hình (MaaS) và Dịch vụ Kinh doanh (BaaS). Sản phẩm và dịch vụ của chúng tôi chủ yếu được ứng dụng trong nhiều ngành công nghiệp khác nhau như ngân hàng, hàng tiêu dùng, bảo hiểm, thương mại điện tử, ô tô, logistics, bán vé, năng lượng và xây dựng. Khách hàng yêu cầu người bản ngữ nói nhiều ngôn ngữ ghi âm để huấn luyện một robot giọng nói thông minh tập trung vào việc quảng bá và thúc đẩy các sản phẩm tài chính ngân hàng, nhằm số hóa hoạt động bán hàng và dịch vụ khách hàng. Khách hàng hy vọng sẽ nâng cao khả năng tương tác của robot thông qua các mẫu giọng nói thực tế này, giúp robot giao tiếp sinh động và tự nhiên hơn với nhóm khách hàng mục tiêu.
Yêu cầu của khách hàng
1. Dự án này cần ba người nói tiếng Anh bản ngữ khác nhau với giọng địa phương khác nhau từ các vùng miền khác nhau (tiếng Anh London, tiếng Anh Mỹ với giọng miền Bắc Washington, tiếng Anh Singapore) cũng như người nói tiếng Tây Ban Nha bản ngữ đến từ Mexico để thu âm.
2. Người tham gia sẽ ghi âm dựa trên văn bản được khách hàng cung cấp, thiết bị ghi âm có thể là điện thoại di động. Người tham gia không cần phải có kinh nghiệm lồng tiếng chuyên nghiệp. Tuy nhiên, do tính chất tương đối khô khan của văn bản được cung cấp, khách hàng hy vọng rằng các diễn viên lồng tiếng có thể linh hoạt và chuyển đổi nội dung văn bản thành cách diễn đạt tự nhiên và phù hợp hơn về mặt cảm xúc dựa trên đặc điểm của các vai diễn khác nhau.
3. Dự án chủ yếu bao gồm hai khía cạnh về yêu cầu dịch vụ ngôn ngữ:
3.1 Rà soát văn bản đã ghi âm. Cần phải chỉnh sửa văn bản về mặt ngôn ngữ và khả năng thích ứng với cách diễn đạt bằng lời nói trong bản ghi âm;
3.2 Ghi hình theo yêu cầu của cảnh quay, và bản ghi sẽ bao gồm hai nhân vật: nhân vật AI và nhân vật người chơi.
Khó khăn của dự án
1. Khó khăn trong việc tìm kiếm nguồn nhân lực: Các quy định khu vực rất nghiêm ngặt, không chỉ yêu cầu tỷ lệ giới tính cân bằng của diễn viên lồng tiếng mà còn phải đảm bảo giọng nói và cảm xúc trong giọng nói đáp ứng các yêu cầu cụ thể của khách hàng;
2. Yêu cầu cao về năng lực quản lý dự án của các công ty dịch thuật: Vì đây là một dự án dịch thuật không theo quy chuẩn, một số nguồn lực thiếu kinh nghiệm làm việc liên quan. Do đó, nhân viên quản lý dự án cần xây dựng các hướng dẫn và tài liệu đào tạo phù hợp dựa trên yêu cầu và phản hồi của khách hàng để tạo điều kiện thuận lợi cho việc đào tạo và giúp nhiều nguồn lực hơn nâng cao năng lực thực hiện dự án, mở rộng phạm vi nguồn lực và giảm sự phụ thuộc vào một số nguồn lực đã có kinh nghiệm;
3. Phương pháp báo giá dựa trên mức giá theo giờ, và khách hàng sẽ cung cấp một phạm vi giờ làm việc ước tính nằm trong giới hạn hợp lý. Tuy nhiên, vì giá đơn vị thấp, nên công ty dịch thuật chỉ có thể nỗ lực tối đa trong “tam giác bất khả thi” quản lý dự án gồm giá cả, chất lượng và thời gian.
Kế hoạch phản hồi dịch thuật của TalkingChina
Làm thế nào để đối mặt với những thách thức về nguồn lực:
Nhằm nâng cao hiệu quả của quá trình ghi âm tiếp theo, chúng tôi đã áp dụng phương pháp làm việc trong đó cùng một người chịu trách nhiệm cả việc rà soát văn bản và ghi âm. Lựa chọn này không chỉ giúp cải thiện độ chính xác của việc hiệu đính mà còn tạo nền tảng tốt cho hiệu quả của các lần ghi âm tiếp theo.
Để đáp ứng yêu cầu của dự án, chúng tôi chủ động tìm kiếm những người bản ngữ có kinh nghiệm làm việc tại các trung tâm dịch vụ khách hàng và tiếp thị qua điện thoại ở các khu vực cụ thể thông qua phần mềm mạng xã hội.
1. Trong quá trình sàng lọc nguồn lực, chúng tôi yêu cầu khách hàng cung cấp một đoạn văn mẫu để chúng tôi có thể gửi cho những người quan tâm để kiểm tra âm thanh. Đồng thời, chúng tôi tiến hành các cuộc họp trực tuyến với khách hàng để trao đổi kỹ lưỡng các chi tiết như giọng điệu và ngữ điệu, nhằm đảm bảo hiểu chính xác nhu cầu và kỳ vọng của họ. Sau khi sàng lọc sơ bộ, chúng tôi đề xuất các mẫu âm thanh xuất sắc cho khách hàng. Sau khi khách hàng xác nhận, chúng tôi sẽ tiến hành hiệu đính văn bản đã ghi âm.
2. Thực hiện công tác hiệu đính văn bản âm thanh: Vì văn bản âm thanh được trình bày dưới dạng hội thoại, chúng tôi chú trọng sử dụng các biểu đạt thông tục trong quá trình hiệu đính, tránh các câu dài phức tạp và ưu tiên các câu ngắn gọn, rõ ràng để truyền tải thông tin tốt hơn. Ngoài ra, ngôn ngữ sử dụng nên càng gần gũi với các biểu đạt thông dụng nhất của người dân địa phương càng tốt, điều này không chỉ tăng tính gần gũi của văn bản mà còn đảm bảo sự hiểu biết của người nghe. Tuy nhiên, trong khi theo đuổi tính thông tục, chúng tôi cũng sẽ kiểm soát chặt chẽ để đảm bảo ý nghĩa gốc của câu không bị thay đổi.
3. Thực hiện công việc ghi âm: Chúng tôi hướng dẫn người tham gia ghi âm một cách sinh động và cuốn hút, tránh học thuộc lòng và tạo ra bầu không khí chân thực cho cuộc đối thoại. Trong quá trình ghi âm, hiệu ứng âm thanh nền cần phải nhất quán để đảm bảo tính mạch lạc tổng thể. Có hai vai trò trong bản ghi âm: vai trò AI và vai trò Người dùng. Chúng tôi hướng dẫn người tham gia dự án thể hiện các phẩm chất tự nhiên, nhiệt tình, thân thiện và thuyết phục khi ghi âm nhân vật AI, trong khi nhân vật Người dùng nên càng giống với trạng thái trả lời điện thoại hàng ngày càng tốt. Giọng điệu tổng thể nên tránh quá nghiêm nghị hoặc trang trọng, và người ghi âm có thể tưởng tượng mình đang trả lời một cuộc gọi tiếp thị để có tương tác thoải mái, càng tự nhiên càng tốt. Cần lưu ý rằng văn bản cuối cùng không thể được chỉnh sửa trong khi ghi âm, nhưng các từ thể hiện tâm trạng như “Được”, “Ừm”, “Chắc chắn rồi”, “Tuyệt vời” có thể được thêm vào một cách tự do để tăng tính sinh động.
4. Đào tạo liên tục cho nhân viên thu âm: Trước khi bắt đầu thu âm chính thức, chúng tôi đã tiến hành đầy đủ các buổi trao đổi và đào tạo trực tuyến cho người tham gia để đảm bảo họ nắm vững giọng điệu và trạng thái thu âm. Sau khi hoàn thành thu âm dự án đầu tiên, chúng tôi sẽ tiếp tục trao đổi và đào tạo nhân viên thu âm dựa trên phản hồi của khách hàng. Quá trình này nhằm giúp họ nhanh chóng tìm ra trạng thái giọng điệu thu âm đáp ứng yêu cầu, từ đó mô phỏng tốt hơn các cảnh hội thoại thực tế. Tất cả tài liệu đào tạo và hướng dẫn được tích lũy thành tài sản kiến thức của dự án, tạo thành một bộ mẫu âm thanh hoàn chỉnh và các yêu cầu tiêu chuẩn bằng văn bản.
5. Thực hiện đầy đủ các biện pháp cảnh báo:
Đầu tiên, chúng tôi đã ký thỏa thuận với từng người tham gia để họ từ bỏ quyền sở hữu trí tuệ đối với giọng nói cá nhân của mình, đồng thời cũng thống nhất rõ ràng với khách hàng về mục đích ghi âm nhằm tránh các tranh chấp tiềm tàng trong tương lai.
Thứ hai, những khác biệt nhỏ về giọng điệu, biểu cảm cảm xúc và các khía cạnh khác của bài phát biểu có thể dẫn đến việc cần phải chỉnh sửa lại. Do đó, trước khi dự án bắt đầu, chúng ta cần đạt được thỏa thuận với tất cả những người tham gia dự án và khách hàng để làm rõ trong những trường hợp nào việc thu âm lại được thực hiện miễn phí và trong những trường hợp nào sẽ tính phí bổ sung. Thỏa thuận rõ ràng này không chỉ giúp kiểm soát chi phí dự án mà còn đảm bảo dự án tiến triển một cách có trật tự theo đúng tiến độ và tiêu chuẩn chất lượng đã thiết lập, tránh tranh chấp.
Trường hợp 2
Bối cảnh dự án
Khách hàng là một doanh nghiệp công nghệ tập trung vào đổi mới xe thông minh, chuyên về các lĩnh vực năng lượng mới, buồng lái thông minh và khung gầm thông minh, nhằm nâng cao khả năng thông minh cho các phương tiện truyền thống. Để cải thiện hiệu suất của hệ thống giọng nói trong xe, khách hàng đã đưa ra nhiều yêu cầu, bao gồm mở rộng hướng dẫn, hướng dẫn đa ngôn ngữ và ghi âm hướng dẫn cho người bản ngữ. Bằng cách thu thập các mẫu giọng nói thực tế này, khách hàng hy vọng sẽ tăng cường khả năng tương tác của hệ thống giọng nói, cho phép hệ thống nhận diện chính xác và hiệu quả các lệnh thoại của người dùng.
Yêu cầu của khách hàng
1. Mở rộng và đa ngôn ngữ hóa hướng dẫn
Khách hàng đã cung cấp đầy đủ các chức năng tiếng Trung cho hệ thống điều khiển bằng giọng nói trên xe của họ. Đối với mỗi chức năng tiếng Trung, chúng tôi sẽ mở rộng thêm ít nhất 20 lệnh thoại liên quan dựa trên mục đích cụ thể của nó. Những hướng dẫn này cần phù hợp với các tình huống sử dụng hàng ngày và được diễn đạt bằng ngôn ngữ thông tục để đảm bảo người dùng có thể tương tác dễ dàng và tự nhiên với hệ thống trong thực tế sử dụng trong tương lai.
Ví dụ:
Chức năng chính: Mô-đun điều hòa không khí
Chức năng phụ: Bật điều hòa
Theo chức năng phụ, cần mở rộng ít nhất 20 lệnh.
Các ngôn ngữ sử dụng: tiếng Anh, tiếng Nga, tiếng Ả Rập.
Yêu cầu ghi âm bằng ngôn ngữ bản địa
Người bản ngữ tiếng Nga và người bản ngữ tiếng Ả Rập đến từ Các Tiểu vương quốc Ả Rập Thống nhất được yêu cầu thực hiện các bản ghi âm riêng biệt dựa trên hướng dẫn đa ngôn ngữ trước đó. Khi ghi âm, cần phải nói tiếng Anh và tiếng Nga, tiếng Anh và tiếng Ả Rập một cách tự nhiên và trôi chảy.
Khách hàng cần thu âm bằng cả tiếng Anh và tiếng Nga, cũng như tiếng Anh và tiếng Ả Rập, theo văn bản được chỉ định tại các địa điểm ở Vũ Hán và Thượng Hải. Mỗi ngôn ngữ cần 10 người thu âm (5 nam và 5 nữ), và bối cảnh thu âm bao gồm văn phòng của khách hàng và một chiếc xe thật trên đường. Nội dung âm thanh cần chính xác, đầy đủ và trôi chảy.
Khó khăn của dự án
Ngân sách hạn chế;
Các công ty dịch thuật đòi hỏi năng lực quản lý dự án rất cao: việc mở rộng và dịch thuật đa ngôn ngữ là những dự án không theo quy chuẩn, yêu cầu đội ngũ quản lý dự án phải xây dựng các hướng dẫn và tài liệu đào tạo phù hợp dựa trên các yêu cầu cụ thể và phản hồi của khách hàng;
Hạn chế về nguồn lực: Khách hàng yêu cầu các bản ghi âm tiếng Ả Rập phải được thực hiện bởi người bản ngữ đến từ Các Tiểu vương quốc Ả Rập Thống nhất và phải được ghi âm trực tiếp tại một thành phố được chỉ định, đồng thời phải xem xét tỷ lệ giới tính của người tham gia ghi âm. Người bản ngữ tiếng Ả Rập từ các quốc gia khác không được chấp nhận.
Kế hoạch phản hồi dịch thuật của TalkingChina
Cách giải quyết những thách thức về nguồn lực:
1.1 Dựa trên đặc điểm của dự án, trước tiên chúng tôi chọn hoàn thành việc mở rộng hướng dẫn sang tiếng Anh. Chúng tôi đã tìm kiếm những người nói tiếng Anh bản ngữ có khả năng hợp tác cao, phản hồi nhanh chóng và hiểu sâu sắc các yêu cầu của dự án trong kho tài nguyên khổng lồ của TalkingChina. Chúng tôi ưu tiên mở rộng 20 hướng dẫn và gửi cho khách hàng để xác nhận. Dựa trên phản hồi của khách hàng, chúng tôi liên tục cập nhật hướng dẫn và cung cấp đào tạo thường xuyên. Trong quá trình mở rộng, chúng tôi luôn duy trì sự hợp tác chặt chẽ với khách hàng và nhanh chóng nêu ra các câu hỏi về các điểm chức năng để hiểu rõ hơn nhu cầu của họ. Chúng tôi sẽ sử dụng tiếng Anh làm mẫu để mở rộng hướng dẫn sang tiếng Nga và tiếng Ả Rập. Chiến lược này không chỉ nâng cao hiệu quả công việc và giảm tỷ lệ làm lại mà còn tạo nền tảng tốt cho hiệu quả ghi âm sau này.
1.2 Để đáp ứng yêu cầu của dự án ghi âm, chúng tôi đã bắt đầu tìm kiếm người bản ngữ tại Vũ Hán, Thượng Hải và các khu vực lân cận. Kết quả là, nguồn nhân lực nói tiếng Nga bản ngữ nhanh chóng có sẵn, nhưng nguồn nhân lực nói tiếng Ả Rập trong nước lại cực kỳ hạn chế và chi phí thường vượt quá ngân sách của khách hàng. Trong tình huống này, chúng tôi đã nhiều lần trao đổi với khách hàng về nhu cầu ghi âm bằng tiếng Ả Rập của họ, và cuối cùng đã đạt được giải pháp thỏa hiệp: thực hiện ghi âm từ xa bởi người Emirati ở nước ngoài trong quá trình ghi âm tĩnh tại văn phòng; trong quá trình ghi âm động trên xe thực tế trên đường, một số người bản ngữ tiếng Ả Rập từ các khu vực ngoài UAE được mời tham gia dự án.
2. Thực hiện công việc ghi âm: Khi thực hiện ghi âm trực tiếp, chúng tôi đã chuẩn bị trước hướng dẫn chi tiết về yêu cầu ghi âm tiếng Anh cho từng người bản ngữ tham gia ghi âm, và lập lịch trình chi tiết dựa trên thời gian của khách hàng và người tham gia. Đối với ghi âm từ xa, chúng tôi cũng cung cấp hướng dẫn ghi âm tiếng Anh cho từng người tham gia dự án và sắp xếp công việc theo nhu cầu của khách hàng. Người tham gia được yêu cầu ghi âm bằng máy tính hoặc điện thoại di động trong môi trường yên tĩnh, giữ khoảng cách từ 20 đến 40 cm so với thiết bị để mô phỏng sự tương tác giữa xe và hệ thống trên xe, và trò chuyện ở âm lượng bình thường. Trước khi bắt đầu ghi âm chính thức, chúng tôi yêu cầu mỗi người tham gia ghi âm một đoạn âm thanh mẫu và chờ xác nhận của khách hàng trước khi bắt đầu ghi âm chính thức.
Tóm tắt và triển vọng dự án
Với sự phát triển nhanh chóng của công nghệ AI, ngành dịch vụ ngôn ngữ đang trải qua những thay đổi chưa từng có. Sự xuất hiện liên tục của các nhu cầu dịch vụ ngôn ngữ mới đặt ra những thách thức mới đối với mô hình dịch vụ và năng lực của các công ty dịch thuật. Dưới đây là tóm tắt hai trường hợp này và một số suy nghĩ về tương lai:
1. Mô hình dịch vụ đổi mới: Các dịch vụ ngôn ngữ truyền thống không còn đáp ứng được nhu cầu thị trường hiện tại, và các mô hình dịch vụ đổi mới như Mô hình như một dịch vụ (MaaS) và Doanh nghiệp như một dịch vụ (BaaS) đang trở thành tiêu chuẩn mới của ngành. Công ty Dịch thuật TalkingChina đã chứng minh cách thích ứng linh hoạt và dẫn đầu sự thay đổi này thông qua hai trường hợp trên.
2. Sự kết hợp giữa công nghệ và nhân văn: Trong kỷ nguyên trí tuệ nhân tạo, sự tiến bộ của công nghệ được kết hợp với những cảm xúc tinh tế và bối cảnh văn hóa của ngôn ngữ con người để cung cấp cho khách hàng trải nghiệm dịch vụ cá nhân hóa và tự nhiên hơn. Thực tiễn dự án của chúng tôi đã chứng minh rằng bằng cách thấu hiểu sâu sắc nhu cầu của khách hàng và sự khác biệt văn hóa, chúng ta có thể tạo ra các sản phẩm dịch vụ ngôn ngữ hấp dẫn hơn.
3. Những thách thức mới trong quản lý dự án: Quản lý dự án ngày nay không chỉ đơn thuần là quản lý quy trình và thời gian, mà còn là quản lý nhân tài, công nghệ và tư duy đổi mới. Công ty dịch thuật TalkingChina đã chứng minh qua hai trường hợp này cách vượt qua những hạn chế về ngân sách và nguồn lực thông qua quản lý hiệu quả và tư duy đổi mới.
4. Tích hợp nguồn lực toàn cầu: Trong bối cảnh toàn cầu hóa, nhu cầu về dịch vụ ngôn ngữ vượt qua biên giới quốc gia, đòi hỏi các công ty dịch thuật phải có khả năng tích hợp các nguồn lực toàn cầu. Trường hợp nghiên cứu của chúng tôi minh họa cách tìm kiếm và sử dụng các nguồn lực phù hợp nhất thông qua mạng lưới toàn cầu để đáp ứng nhu cầu cụ thể của khách hàng.
5. Bảo vệ quyền sở hữu trí tuệ: Trong khi cung cấp dịch vụ ngôn ngữ, chúng ta cũng phải coi trọng việc bảo vệ quyền sở hữu trí tuệ. Bằng cách ký kết thỏa thuận với các bên tham gia để làm rõ phạm vi và mục đích sử dụng tài liệu âm thanh, chúng ta có thể ngăn ngừa các rủi ro pháp lý tiềm ẩn.
6. Học hỏi và thích ứng liên tục: Với sự phát triển nhanh chóng của công nghệ AI, các công ty dịch thuật phải liên tục học hỏi những công nghệ và xu hướng ngành mới nhất để thích ứng với môi trường thị trường luôn thay đổi. Kinh nghiệm từ các dự án của chúng tôi đã tích lũy được những kiến thức quý giá, tạo nền tảng vững chắc cho sự phát triển trong tương lai.
Cả hai trường hợp này đều đạt được kết quả tốt cho đến nay. Chúng tôi không chỉ cung cấp dịch vụ ngôn ngữ chất lượng cao cho khách hàng mà còn thiết lập các tiêu chuẩn dịch vụ mới cho ngành. Trong tương lai, Công ty Dịch thuật TalkingChina sẽ tiếp tục tìm tòi và đổi mới để đáp ứng nhu cầu dịch vụ ngôn ngữ không ngừng phát triển trong kỷ nguyên AI.
Thời gian đăng bài: 09/06/2025