Công nghệ sinh trắc học đã trở nên phổ biến trong thế giới kỹ thuật số đầu tiên ngày nay, cách mạng hóa cách chúng ta xác thực và xác minh danh tính từ xa. Có nhiều phương thức sinh trắc học mà các tổ chức đang sử dụng để xác nhận danh tính của người dùng của họ.

Một lựa chọn phổ biến là sinh trắc học giọng nói, đã đạt được sức hút đáng kể trong lĩnh vực ngân hàng tư nhân và quản lý tài sản. Công nghệ này đã được áp dụng để giúp xác thực khách hàng nhanh hơn và an toàn hơn - nguyên tắc hoạt động đằng sau sinh trắc học giọng nói là mọi người luôn có giọng nói bên mình và mỗi giọng nói chỉ nên thuộc về một cá nhân.

Tuy nhiên, công nghệ sinh trắc học giọng nói đã trở thành tiêu đề gần đây - nổi tiếng là một trong những "sinh trắc học dễ nhân bản nhất". Công nghệ "nhân bản giọng nói" tổng hợp nói riêng đã trở thành một rủi ro ưu việt, vì các công cụ được sử dụng để lừa giọng nói một cách thực tế ngày càng dễ tiếp cận hơn. Một mẫu giọng nói tổng hợp chất lượng cao có thể dễ dàng đánh lừa tai người, với MIT Google báo cáo rằng một phút dữ liệu giọng nói là tất cả những gì cần thiết để tạo ra âm thanh thuyết phục, chất lượng con người.

Tuy nhiên, nhân bản không phải là điểm yếu duy nhất, vì có những lo ngại bổ sung về đảm bảo danh tính, hiệu suất và khả năng truy cập mà sinh trắc học giọng nói có thể cung cấp.

Blog này là phần đầu tiên của loạt bài về sinh trắc học giọng nói. Loạt bài này sẽ trình bày chi tiết về hiệu suất, hiệu quả và sự phát triển của công nghệ giọng nói tổng hợp do AI tạo ra, cũng như tiềm năng bảo mật mạnh mẽ hơn bằng cách sử dụng xác minh khuôn mặt sinh trắc học. Trong bài viết này, chúng tôi sẽ xem xét liệu sinh trắc học giọng nói có còn đóng một vai trò trong các giao dịch tài chính hay không.

Sinh trắc học giọng nói là gì?

Công nghệ sinh trắc học giọng nói đo lường các dấu hiệu vật lý và hành vi trong lời nói của một cá nhân để xác nhận danh tính của họ. Công nghệ này hoạt động bằng cách so sánh các tính năng trong một mẫu âm thanh nhất định (hoặc nguồn cấp dữ liệu âm thanh trực tiếp) với mẫu "giọng nói" thu được từ (các) bản ghi âm trước đó.

Với sự gia tăng mạnh mẽ của ngân hàng kỹ thuật số, sinh trắc học giọng nói đã trở thành một hình thức xác thực phổ biến cho các tổ chức tài chính. Các cuộc gọi dịch vụ khách hàng theo truyền thống đóng một vai trò quan trọng trong trải nghiệm ngân hàng và sinh trắc học giọng nói cho phép xác thực khách hàng trong cùng một kênh liên lạc. Tuy nhiên, phương pháp này dễ bị tiếng ồn xung quanh, có thể bị nghe lén và có thể bị giả mạo bởi một bản ghi âm hoặc deepfake.

Generative AI đã đẩy nhanh sự phát triển của công nghệ nhân bản giọng nói, có thể tạo ra giọng nói giống hệt giọng nói thật. Mặc dù khái niệm giọng nói tổng hợp đe dọa nhiều lĩnh vực của cuộc sống, nhưng trong phần này, chúng tôi tập trung đặc biệt vào hiệu quả của sinh trắc học giọng nói đối với bảo mật tổ chức (tức là xác thực hoặc xác minh danh tính từ xa).

Sự khác biệt giữa sinh trắc học giọng nói và các phương thức khác, chẳng hạn như sinh trắc học khuôn mặt là gì?

Mỗi phương thức sinh trắc học sử dụng một đặc điểm độc đáo khác nhau - chẳng hạn như khuôn mặt, mống mắt hoặc dấu vân tay - để xác định một cá nhân và các quyết định xung quanh việc mua sắm công nghệ sinh trắc học thường được sử dụng theo trường hợp.

Sinh trắc học giọng nói thường không được sử dụng để giới thiệu khách hàng mới, nhưng để xác thực quyền truy cập dịch vụ khách hàng bằng cách quay lại khách hàng khi các cá nhân cần trợ giúp qua điện thoại. Các mẫu lời nói của họ được phân tích thụ động trong khi họ nói. Ngoài ra, sinh trắc học giọng nói có thể được triển khai trong ứng dụng ngân hàng - ứng dụng yêu cầu người dùng nhấn vào nút và nói cụm mật khẩu để có quyền truy cập ban đầu hoặc tăng cường vào các dịch vụ khác.

Ngược lại, công nghệ sinh trắc học khuôn mặt có thể được sử dụng cho cả việc giới thiệu và xác thực người dùng liên tục. Một điểm khác biệt thiết yếu để xác minh khuôn mặt sinh trắc học là khuôn mặt có thể được khớp với tài liệu ID đáng tin cậy do chính phủ cấp, trong khi giọng nói thì không. Sinh trắc học giọng nói không thể đảm bảo điểm rủi ro cao nhất trong hành trình của người dùng: giới thiệu. Do đó, nó không cung cấp biện pháp bảo vệ chống lại các loại gian lận danh tính phổ biến và gây tổn hại nhất, chẳng hạn như gian lận danh tính tổng hợp. Điều này hạn chế việc sử dụng công nghệ vì nó không thể cung cấp sự đảm bảo danh tính cần thiết.

Ngay cả đối với trường hợp sử dụng dự định của nó, tính bảo mật của sinh trắc học giọng nói đã nhiều lần bị phá hoại. Một bài báo kiểm tra một cuộc tấn công thực tế vào các hệ thống xác thực giọng nói từ Đại học Waterloo, Canada, đã phát triển một phương pháp có thể vượt qua xác thực giọng nói quan trọng về bảo mật ở dạng nghiêm ngặt nhất với tỷ lệ thành công lên tới 99%.

Nghiên cứu này cũng phát hiện ra rằng các hệ thống xác thực giọng nói có xu hướng "học nhầm cách phân biệt giữa âm thanh giả mạo và âm thanh giả mạo dựa trên các tín hiệu dễ nhận biết" - và do đó dễ dàng bị giả mạo. Và trong khi các mối đe dọa đã nhanh chóng phát triển và phát triển, công nghệ vẫn giữ nguyên.

Do xác thực giọng nói thường được sử dụng trong các ngành có rủi ro cao, có giá trị cao - bao gồm ngân hàng tư nhân và quản lý tài sản - việc sử dụng và khả năng phục hồi bảo mật của sinh trắc học giọng nói cần được kiểm tra. Các công nghệ trưởng thành khác có thể chứng minh sự tuân thủ các tiêu chuẩn hiệu suất sinh trắc học và chứng minh đánh giá theo tiêu chuẩn của chính phủ nên được ưu tiên. 

Nghiên cứu điển hình & bối cảnh sinh trắc học giọng nói

Để hiểu tại sao hiệu quả của sinh trắc học giọng nói đang thu hút sự chú ý quan trọng, chúng ta hãy xem một số tiêu đề từ năm nay:

  • AI đánh lừa nhận dạng giọng nói được sử dụng để xác minh danh tính của Centrelink và cơ quan thuế Úc: chứng minh công nghệ sinh trắc học giọng nói đã thất bại như thế nào trong việc giữ an toàn cho các cá nhân trong các dự án lớn, quy mô quốc gia.
  • VALL-E AI mới của Microsoft có thể sao chép giọng nói của bạn từ một đoạn âm thanh dài ba giây: làm nổi bật cách rào cản tạo bản sao giọng nói do AI tạo ra đang bốc hơi, giúp những kẻ lừa đảo dễ dàng làm suy yếu bảo mật sinh trắc học giọng nói.
  • Phóng viên, Joseph Cox, đã có thể vượt qua các chương trình ID giọng nói của Ngân hàng Lloyds có trụ sở tại Vương quốc Anh để truy cập vào tài khoản ngân hàng của chính mình: Cox đã sử dụng một bản sao giọng nói của chính mình được hỗ trợ bởi AI để thực hiện hành vi gian lận. Anh ta có thể thấy số dư của chính mình, danh sách các giao dịch gần đây và chuyển khoản. 
  • Các thượng nghị sĩ Hoa Kỳ viết thư cho Cục Bảo vệ Tài chính Người tiêu dùng kêu gọi hành động liên quan đến "quản trị trí tuệ nhân tạo": đặc biệt liên quan đến nhân bản giọng nói và "ứng dụng đáng báo động của nó trong việc thực hiện các trò gian lận tài chính". Đây không phải là lần đầu tiên - vào tháng Năm, các Thượng nghị sĩ đã gửi thư cho sáu ngân hàng lớn nhất cung cấp xác thực giọng nói nêu rõ những lo ngại rằng "các clip thoại do AI tạo ra cho phép các tác nhân gian lận đột nhập vào tài khoản của khách hàng". Sự mong manh của sinh trắc học giọng nói đã thu hút sự chú ý của các nhân viên chính phủ và các nhà quản lý. 

Cuối cùng, điều này đặt ra câu hỏi: tổ chức của bạn có các giao thức đảm bảo danh tính linh hoạt không? Các quy trình bảo mật của bạn có thể chống lại bối cảnh mối đe dọa đang phát triển và thực tế của các công nghệ tội phạm mạng ngày càng tinh vi không?

Để giúp đỡ, iProov sẽ phát hành các phát hiện, nghiên cứu, so sánh và ví dụ trường hợp sử dụng của công nghệ sinh trắc học giọng nói trong những tháng tới. Chúng tôi sẽ kiểm tra cách nó được triển khai và đưa ra các khuyến nghị dựa trên khẩu vị rủi ro và mức độ đảm bảo.

Để biết thêm thông tin về các công nghệ xác minh khuôn mặt sinh trắc học khác nhau trên thị trường, cùng với các điểm khác biệt chính của chúng, hãy đọc ebook Xác minh khuôn mặt sinh trắc học làm sáng tỏ của chúng tôi tại đây.

Nếu bạn muốn tìm hiểu thêm về công nghệ xác minh khuôn mặt sinh trắc học của iProov - hoặc cách chuyển đổi từ sinh trắc học giọng nói sang khuôn mặt - bạn có thể liên hệ với chúng tôi hoặc đặt bản demo trực tiếp tại đây.

Đọc tiếp theo: Nhược điểm & Lỗ hổng của Sinh trắc học giọng nói | Giải pháp thay thế là gì?

Hình ảnh 11