Công nghệ chuyển đổi giọng nói thành văn bản – bí mật “tốc ký” thời 4.0 của giới nhà báo, phóng viên

Đánh giá

Thay vì tốc ký hay ghi âm sau đó biên soạn lại nội dung, giờ đây cánh nhà báo, phóng viên có thể lên tin bài chỉ trong tích tắc nhờ công nghệ chuyển đổi giọng nói thành văn bản

Phóng viên, nhà báo và những nỗi lòng không phải ai cũng thấu

Tin bài nóng cần cập nhật liên tục không sẽ hết HOT, chậm một phút là bài đăng “bay” xuống tận trang 2 của Google, những phỏng vấn độc quyền hôm nay không đăng ngày mai hết “nhiệt”,… là những éo le của ngành báo chí, truyền thông mà người trong giới ai cũng “thấm”. 

Chưa kể đến phóng viên, nhà báo là những người luôn phải di chuyển, nhiều lúc phải mang theo những thiết bị ghi âm, thu hình kềnh càng. Thu âm xong lại phải vật vã nghe đi nghe lại file để chắt lọc thông tin, biên tập nội dung mới có thể cho ra tin bài hoàn chỉnh. Tất cả trở thành nỗi ám ảnh mà “nghe thôi cũng thấy sợ”.

Tuy nhiên, với sự phát triển của công nghệ, đặc biệt là sự ra đời của công nghệ nhận dạng giọng nói thành văn bản, mọi thứ đều trở nên đơn giản hơn nhiều! 

Công nghệ chuyển đổi giọng nói giúp phóng viên, nhà báo soạn thảo nhanh chóng

Công nghệ chuyển đổi giọng nói giúp phóng viên, nhà báo soạn thảo nhanh chóng

 

Công nghệ chuyển đổi giọng nói thành văn bản là gì?

Sự phát triển của chuyển đổi số đã kéo theo sự ra đời của hàng loạt các công nghệ số tiêu biểu hỗ trợ con người thuận tiện hơn trong công việc. Trong đó có công nghệ chuyển đổi giọng nói thành văn bản.
Công nghệ này cho phép người dùng thu âm và chuyển trực tiếp giọng nói/ nội dung file ghi âm thành văn bản text tức thì. Nó thường được sử dụng để tạo ra các phần mềm/ ứng dụng chuyển đổi giọng nói sang văn bản có thể sử dụng trên các thiết bị điện thoại hoặc máy tính, các ứng dụng nhà thông minh hoặc tích hợp trong hệ thống tổng đài tự động để nâng cao dịch vụ chăm sóc khách hàng,…

Công nghệ chuyển giọng nói thành văn bản

Công nghệ chuyển giọng nói thành văn bản

 

Thông thường công nghệ chuyển giọng nói thành văn bản thường được tích hợp thêm các cơ chế bổ sung giọng nói, văn phong, học máy (machine learning), học sâu,… để nâng cao khả năng nhận dạng và chất lượng khi chuyển đổi. Một số phần mềm ứng dụng công nghệ này thậm chí còn được nâng cấp để có thể nhận dạng giọng nói ở nhiều vùng miền và nhận dạng chính xác ngay cả trong môi trường nhiễu.

Ngày nay, công nghệ chuyển đổi giọng nói thành văn bản được sử dụng ở nhiều lĩnh vực, ngành nghề với các mục đích sử dụng khác nhau. Điển hình như phóng viên – nhà báo sử dụng để chuyển các file ghi âm phỏng vấn thành bài viết, youtuber sử dụng để tạo sub cho video, giáo viên sử dụng để lưu trữ dữ liệu bài giảng, doanh nghiệp/tổ chức nhà nước dùng để chuyển nội dung cuộc họp thành biên bản họp,…

Có thể thấy công nghệ này đang ngày càng phổ biến và có thể sẽ còn phát triển hơn nữa trong tương lai. Đặc biệt là trong ngành báo chí khi mà ngành này “tốc độ” luôn là yếu tố cốt lõi để tạo nên thành công.

“Tốc ký” thời 4.0 với V-IONE – công nghệ chuyển đổi giọng nói thành văn bản chuyên nghiệp

Phần mềm chuyển đổi giọng nói thành văn bản V-IONE là sản phẩm “make in Vietnam” đạt giải Nhất Nhân tài Đất Việt 2019 do FSI nghiên cứu và phát triển, giúp chuyển đổi giọng nói Tiếng Việt trong các cuộc họp thành văn bản tức thì với độ chính xác lên đến 98%.
V-IONE ứng dụng và nâng cấp từ những tính năng ưu việt của công nghệ chuyển đổi giọng nói thành văn bản như: chuyển trực tiếp giọng nói thành văn bản; xử lý chuyển sang số khi nói đến ngày, tháng, năm; xử lý chữ viết hoa đối với đơn vị hành chính cấp tỉnh, thành phố; phân đoạn văn bản theo giọng người nói (mỗi người một đoạn); kiểm tra, đối chiếu nội dung nhanh chóng;…

Phần mềm chuyển giọng nói sang văn bản V-IONE sở hữu nhiều tính năng ưu việt

Phần mềm chuyển giọng nói sang văn bản V-IONE sở hữu nhiều tính năng ưu việt

Ngoài ra phần mềm còn được cải tiến thêm một số tính năng mới như: nhận dạng chính xác giọng nói ở khoảng cách xa và môi trường nhiễu với tới 95%; tối ưu giọng nói 3 miền Bắc, Trung, Nam; tích hợp tới 7000 từ vựng tiếng việt. Nhờ đó giúp các phóng viên, nhà báo có thể ghi âm và chuyển sang văn bản ngay tức thì với độ chính xác cao mà không cần phải lo lắng đang phỏng vấn ở các buổi họp báo, hội thảo ồn ào.

Với sự hỗ trợ đắc lực của phần mềm chuyển giọng nói thành văn bản V-IONE, file ghi âm 60 phút ngồi nghe đi nghe lại mất thêm 1 – 2 giờ, hiện chỉ cần 6 phút là có thể xử lý xong. phóng viên, nhà báo cũng không cần phải mang vác những thiết bị kềnh càng mỗi lần đi lấy tin bài nữa bởi ứng dụng có thể sử dụng ngay trên chiếc smartphone của bạn. Phần mềm cũng giúp bạn hạn chế tối đa rủi ro sai lệch thông tin nhờ tính năng chỉnh sửa trực tiếp trên màn hình điện thoại/máy tính.

Nỗi lo phải “tốc ký” nhanh, đăng bài sớm chắc hẳn không còn là vấn đề quan ngại của các đơn vị thông tấn báo chí ngày nay nữa khi công nghệ chuyển đổi giọng nói thành văn bản đang ngày càng khẳng định được sức nặng và vai trò của mình trong công việc của các nhà báo, phóng viên.