Chúng tôi tự hào giới thiệu Veo - mô hình có khả năng tạo video chất lượng cao và Imagen 3 - mô hình chuyển đổi văn bản thành hình ảnh tiên tiến nhất của Google. Đồng thời, chúng tôi cũng chia sẻ thêm về loại âm nhạc thử nghiệm mới nhất được tạo ra bởi Music AI Sandbox.
Bài gốc: https://blog.google/technology/ai/google-generative-ai-veo-imagen-3/
Tác giả: Eli Collins, Vice President, Product Management and Doug Eck, Senior Research Director
Trong năm qua, Google đã có những bước tiến đáng kinh ngạc trong việc nâng cao chất lượng của các công nghệ truyền thông thế hệ mới. Chúng tôi đã hợp tác chặt chẽ với cộng đồng sáng tạo để khám phá ra cách các công cụ trí tuệ nhân tạo (AI) thế hệ mới có thể hỗ trợ tốt nhất cho quy trình sáng tạo của họ và đảm bảo rằng các công cụ AI tạo sinh của Google hữu ích nhất có thể ở mỗi giai đoạn.
Hôm nay, chúng tôi rất vui mừng giới thiệu Veo - mô hình tạo video tiên tiến nhất và mới nhất của chúng tôi. Cùng với đó là Imagen 3 - mô hình chuyển đổi văn bản thành hình ảnh có chất lượng cao nhất từ trước đến nay của Google.
Ngoài ra, chúng tôi cũng muốn chia sẻ một số dự án hợp tác gần đây của Google với nhà làm phim Donald Glover và studio sáng tạo của ông, Gilga, cùng các bản nhạc mới được tạo ra với sự trợ giúp từ Music AI Sandbox và được phát hành bởi các nghệ sĩ Wyclef Jean, Marc Rebillet và nhạc sĩ Justin Tranter.
Veo: Mô hình tạo video tiên tiến nhất của Google
Veo là mô hình tạo video tiên tiến nhất của Google tính đến thời điểm hiện tại. Mô hình này có khả năng tạo ra các video có độ phân giải 1080p chất lượng cao, với thời lượng có thể kéo dài hơn một phút và thể hiện được nhiều phong cách điện ảnh, hình ảnh khác nhau.
Veo có hiểu biết nâng cao về ngôn ngữ tự nhiên và ngữ nghĩa hình ảnh, đồng thời tạo ra video tái hiện gần như hoàn hảo tầm nhìn sáng tạo của người dùng bằng cách khắc hoạ các chi tiết trong câu lệnh dài và nắm bắt tông điệu tổng thể một cách chính xác.
Mô hình này cũng hiểu rõ các thuật ngữ điện ảnh như “timelapse” (chụp ảnh tua nhanh thời gian) hoặc “aerial shots of a landscape” (ảnh chụp phong cảnh từ trên không), mang lại cho người dùng khả năng kiểm soát sáng tạo chưa từng có. Veo cũng tạo ra những cảnh quay nhất quán và mạch lạc, tái hiện chuyển động chân thực của con người, động vật và vật thể trong suốt các khung hình.
Để khám phá cách Veo có thể hỗ trợ cho quá trình sáng tạo của người kể chuyện một cách tốt nhất, chúng tôi hiện đang gửi lời mời kêu gọi các nhà làm phim và nhà sáng tạo thử nghiệm mô hình này. Những màn kết hợp này cũng giúp Google cải thiện cách thiết kế, xây dựng và triển khai các công nghệ của mình để đảm bảo rằng tiếng nói của những nhà sáng tạo được lắng nghe trong quá trình phát triển công cụ.
Dưới đây là bản xem trước tác phẩm mà nhà làm phim Donald Glover và studio sáng tạo Gilga đã thử nghiệm với mô hình Veo trong một dự án phim.
VIDEO
Veo là sự tiếp nối của nhiều năm nghiên cứu và phát triển mô hình tạo video của Google, bao gồm Generative Query Network (GQN), DVD-GAN , Imagen-Video , Phenaki , WALT , VideoPoet and Lumiere — kết hợp kiến trúc, các quy luật tỷ lệ và kỹ thuật mới lạ khác để cải thiện chất lượng và độ phân giải đầu ra.
Với Veo, chúng tôi đã thực hiện cải tiến các kỹ thuật về cách mô hình học hỏi để hiểu nội dung của video, tạo ra hình ảnh có độ phân giải cao, mô phỏng vật lý trong thế giới của chúng ta và hơn thế nữa. Những kiến thức này sẽ thúc đẩy sự tiến bộ trong nghiên cứu AI của Google và cho phép chúng tôi xây dựng các sản phẩm hữu ích hơn, từ đó giúp mọi người tương tác và giao tiếp theo những cách thức mới.
Bắt đầu từ hôm nay, Veo đã có sẵn dưới dạng bản xem trước riêng tư trong VideoFX dành cho một số nhà sáng tạo nhất định. Bạn cũng có thể đăng ký tham gia vào danh sách chờ để được trải nghiệm mô hình này sớm nhất. Trong tương lai, chúng tôi cũng sẽ tích hợp một số tính năng của Veo vào YouTube Shorts và các sản phẩm khác.
Vui lòng tìm hiểu thêm về các tính năng của Veo tại đây .
Imagen 3: Mô hình chuyển đổi văn bản thành hình ảnh có chất lượng cao nhất của Google
Trong năm qua, chúng tôi đã đạt được tiến bộ đáng kinh ngạc trong việc cải thiện chất lượng và độ trung thực của các mô hình và công cụ sáng tạo hình ảnh của mình.
Imagen 3 là mô hình chuyển đổi văn bản thành hình ảnh có chất lượng cao nhất của Google. Mô hình này có khả năng tái tạo chi tiết ở mức độ đáng kinh ngạc, sản xuất ra những hình ảnh sống động, chân thực, đồng thời giảm thiểu các chi tiết gây nhiễu loạn một cách đáng kể so với các mô hình trước đó.
Imagen 3 hiểu rõ hơn về ngôn ngữ tự nhiên, mục đích đằng sau mỗi câu lệnh và có khả năng kết hợp các chi tiết nhỏ từ các câu lệnh dài. Chi tiết bổ sung này giúp tăng cường khả năng sáng tạo hình ảnh của Imagen 3 ở nhiều phong cách khác nhau.
Đây cũng là mô hình tốt nhất của chúng tôi khi nói đến khả năng hiển thị văn bản, vốn là một thách thức với các mô hình sáng tạo hình ảnh khác. Tính năng cho phép các nhà sáng tạo tạo ra thông điệp sinh nhật được cá nhân hoá, slide tiêu đề cho bài thuyết trình và các tác vụ khác.
Bắt đầu từ hôm nay, Imagen 3 đã có sẵn dưới dạng bản xem trước riêng tư trong ImageFX dành cho một số nhà sáng tạo nhất định. Bạn cũng có thể đăng ký tham gia vào danh sách chờ để được trải nghiệm mô hình này sớm nhất. Imagen 3 sẽ sớm có mặt trên Vertex AI .
Vui lòng tìm hiểu thêm về các tính năng của Imagen 3 tại đây .
Màn kết hợp của Google với cộng đồng âm nhạc
Là một phần của hành trình khám phá vai trò của AI trong việc sáng tạo nghệ thuật và âm nhạc, chúng tôi hiện đang phối hợp cùng YouTube để hợp tác với một số nhạc sĩ, người viết ca khúc và các nhà sản xuất âm nhạc.
Những màn hợp tác này cũng đồng thời cung cấp thông tin về sự phát triển của các công nghệ âm nhạc thế hệ mới của chúng tôi, bao gồm Lyria - mô hình sáng tạo âm nhạc bằng AI tiên tiến nhất của Google.
Là một phần của công việc này, chúng tôi đã và đang thiết kế cũng như xây dựng bộ công cụ âm nhạc AI mang tên Music AI Sandbox. Đây là bộ công cụ được thiết kế để mở ra một sân chơi sáng tạo mới, cho phép người dùng tạo ra các phần nhạc cụ mới từ đầu, biến đổi âm thanh theo cách riêng và tự do sáng tạo nhiều hơn thế nữa.
VIDEO
Hôm nay, chúng tôi tiếp tục các cuộc thử nghiệm âm nhạc với nhạc sĩ đoạt giải Grammy Wyclef Jean, nhạc sĩ điện tử Marc Rebillet và nhạc sĩ được đề cử giải Grammy Justin Tranter. Đây là các nhà sáng tạo đã phát hành bản ghi demo được tạo bằng công cụ AI âm nhạc của Google trên kênh YouTube của họ.
VIDEO
Trách nhiệm trong thiết kế, phát triển và triển khai các mô hình, công cụ sáng tạo
Tại Google, chúng tôi không chỉ quan tâm đến việc thúc đẩy tiến bộ của nghệ thuật mà còn làm điều đó một cách có trách nhiệm. Vì vậy, chúng tôi đang thực hiện các biện pháp để giải quyết những thách thức do các công nghệ thế hệ mới đặt ra, đồng thời hỗ trợ người dùng lẫn các tổ chức làm việc có trách nhiệm với nội dung được tạo ra bằng trí tuệ nhân tạo.
Đối với mỗi công nghệ này, chúng tôi đã hợp tác với cộng đồng sáng tạo và các bên liên quan để thu thập thông tin chi tiết và lắng nghe phản hồi, từ đó cải thiện và triển khai các công nghệ của mình một cách an toàn và có trách nhiệm.
Chúng tôi đã thực hiện các bài kiểm tra an toàn, áp dụng bộ lọc, thiết lập các nguyên tắc bảo vệ và đặt các nhóm an toàn vào trung tâm của quá trình phát triển. Đội ngũ của chúng tôi cũng tiên phong trong việc phát triển các công cụ như SynthID , có khả năng nhúng các dấu ấn kỹ thuật số (digital watermark) khó nhận thấy để xác thực nguồn gốc của các hình ảnh, âm thanh, văn bản và video do AI tạo ra. Và bắt đầu từ hôm nay, tất cả các video được tạo bởi Veo trên VideoFX đều sẽ được đánh dấu bằng SynthID .
Tiềm năng của AI tạo sinh thế hệ mới là vô cùng to lớn và chúng tôi rất vui mừng khi được chứng kiến cách mọi người trên khắp thế giới biến ý tưởng của họ thành hiện thực với các mô hình và công cụ mới của Google.
CDN Giá Rẻ
Trả lờiXóaChống DDOS cung cấp một lớp bảo vệ mạnh mẽ, giúp ngăn chặn các cuộc tấn công DDOS, đảm bảo an toàn cho dữ liệu và hạ tầng mạng của bạn. Với mức chi phí hợp lý, dịch vụ này không chỉ giúp bạn bảo vệ hệ thống mà còn tối ưu hóa hiệu suất và khả năng truy cập của người dùng.
Việt Đức cũng kết hợp với các nhà sáng tạo ra mắt các mô hình và công cụ truyền thông thế hệ mới trong dịch vụ thu mua phế liệu cua công typhế liệu Việt Đức và nhận được nhiều tiến triển tốt
Trả lờiXóanội dung được tạo ra bằng trí tuệ nhân tạo luôn là điều mới mẻ mà phế liệu Bảo Minh hướng tới người dùng.
Trả lờiXóaCông ty vệ sinh Hưng Thuận là đơn vị dịch vụ vệ sinh uy tín tại Hà Nội
Trả lờiXóaTrong thế giới bóng đá đầy sôi động và hấp dẫn, việc nắm bắt thông tin về Lịch thi đấu luôn là nhu cầu thiết yếu của người hâm mộ. Hiểu được điều này, Nhacaiuytin39 đã không ngừng cập nhật và cung cấp cho người chơi một nền tảng theo dõi lịch thi đấu chính xác và nhanh chóng nhất. Hãy cùng khám phá những điểm nổi bật của dịch vụ này tại Nhacaiuytin39.
Trả lờiXóaForesta Khang Điền là sự lựa chọn hoàn hảo cho những ai tìm kiếm một không gian sống xanh và tiện nghi tại Thủ Đức. Được phát triển bởi Khang Điền, dự án cam kết chất lượng và an toàn cho cư dân. Với thiết kế thông minh và các tiện ích cao cấp như công viên, hồ bơi, và khu vui chơi trẻ em, Foresta mang lại cuộc sống an lành và thoải mái.
Trả lờiXóaXem thêm: Foresta Khang Điền
Nếu bạn đang tìm kiếm nơi in card visit tại Hà Nội với chất lượng và giá cả hợp lý, đừng bỏ qua In Card Visit Hà Nội. Chúng tôi cũng có nhiều mẫu thiết kế đẹp và sáng tạo, giúp bạn nổi bật trong mắt khách hàng. Tham khảo thêm tại In Card Visit Đẹp.
Trả lờiXóaDịch Vụ In Lịch Tết Số Lượng Lớn Với Chiết Khấu Cao
Trả lờiXóaIn Minh Khôi mang đến chính sách chiết khấu hấp dẫn cho khách hàng in lịch Tết với số lượng lớn, giúp doanh nghiệp tiết kiệm chi phí tối đa.
Kiến trúc ATZ LUXURY
Trả lờiXóaMẫu thiết kế biệt thự nhà vườn đẹp, nơi bạn sẽ tìm thấy sự bình yên và hòa hợp trong căn phòng gắn liền với thiên nhiên, nơi cung cấp những tiện ích hiện đại. Xem ngay: https://atzluxury.com/biet-thu-nha-vuon/
#atzluxury #kientrucatzluxury #bietthunhavuon #nhavuon