Sử dụng AI, Nvidia giúp bạn có được hình ảnh đẹp đến bất ngờ mỗi lần g

  -  

Thay vì phụ thuộc vào thuật toán nén video, Nvidia quyết định khai thác trí tuệ nhân tạo để tái tạo gương mặt người dùng ngay theo thời gian thực.

Đại dịch Covid-19 đang buộc nhiều người phải làm việc từ xa thay vì đến văn phòng. Tuy nhiên, vẫn có đến hàng ngàn lý do khiến người dùng ghét phải xuất hiện trong các cuộc gọi video với đồng nghiệp, một trong những điều đó là các thuật toán nén video xấu xí đôi khi làm gương mặt bạn không thể nhận ra được.

Nvidia đang có một giải pháp cho vấn đề này, nhưng thay vì sửa chữa các thuật toán nén video, hãng này muốn sử dụng các mạng lưới thần kinh nhân tạo để tái tạo lại gương mặt bạn theo thời gian thực.

Sử dụng AI, Nvidia giúp bạn có được hình ảnh đẹp đến bất ngờ mỗi lần gọi video - Ảnh 1.

Cũng như các dịch vụ stream video trên internet, như YouTube hay Netflix, các thuật toán nén video được sử dụng để giảm lượng băng thông cần thiết nhằm đảm bảo cuộc gọi video vẫn diễn ra trong bất kỳ điều kiện tốc độ mạng nào.

Để làm được như vậy, các thuật toán này sử dụng nhiều thủ thuật khác nhau, bao gồm giảm độ chuẩn màu, giảm tốc độ khung hình và nội suy chúng sau đó, hoặc thậm chí giảm độ phân giải của video - điều thường khiến mọi người trông như họ đang gọi nhau bằng các webcam của thập niên 90. Trong khi các thuật toán nén video hầu như không mấy cải thiện trong thời gian qua, Nvidia đang cho thấy giải pháp của họ đạt được những tiến bộ xa như thế nào.

Nvidia gọi giải pháp mới này là nén video AI. Thay vì gửi một chuỗi các tín hiệu video tới internet với tốc độ 15 đến 30 khung hình mỗi giây, nó sẽ chỉ gửi một số lượng rất nhỏ các khung hình theo một khoảng thời gian cụ thể, còn được gọi là các keyframe.

00:02:26

Nếu xem một đoạn video với các khung hình keyframe này, bạn sẽ cảm tưởng như đang xem một đoạn slideshow giật vậy, nhưng điều này cũng giúp hệ thống phân tích, trích xuất, và chia sẽ dữ liệu về các vị trí và chuyển động của các điểm cụ thể trên gương mặt của chủ thể, để tạo thành một dòng dữ liệu khi so sánh với các dữ liệu khác.

Ở phía nhận dữ liệu, một mạng thần kinh nhân tạo vận hành bằng các card đồ họa mạnh mẽ sẽ sử dụng các điểm dữ liệu này để sản sinh ra các khung hình bổ sung nằm giữa các khung hình keyframe. Điều này sẽ tạo ra một đoạn video chuyển động mượt mà và không có hiện tượng nhòe ảnh như thường thấy trong các thuật toán nén video.

Không chỉ làm người dùng nhận được hình ảnh đẹp hơn, các nhà nghiên cứu của Nvidia ước tính rằng băng thông cần thiết cho việc stream video sử dụng giải pháp nén video AI có thể giảm chỉ bằng 1/10 so với băng thông nén các chuẩn video thông thường như H.264.

Điều này có nghĩa là ngay cả khi bạn phải video call trên smartphone với tín hiệu dữ liệu không đều, vẻ đẹp của bạn vẫn được giữ nguyên nếu người nhận cuộc gọi đang ở trong văn phòng với một kết nối internet nhanh, mạnh và ổn định, cũng như không bị chiếm quá nhiều dung lượng hàng tháng cho tính năng này.

Yếu tố ảnh hưởng đến tổ chức sự kiện Tín Nhân - tổ chức sự kiện cần những gì?

Tham khảo: Gizmodo