您现在的位置是:NEWS > Nhận định
Chợ dữ liệu âm thầm mà nhộn nhịp trong thời AI bùng nổ
NEWS2025-02-01 17:59:51【Nhận định】7人已围观
简介Vào thời kỳ đỉnh cao đầu những năm 2000,ợdữliệuâmthầmmànhộnnhịptrongthờiAIbùngnổbao the thao 24h Phobao the thao 24hbao the thao 24h、、
Vào thời kỳ đỉnh cao đầu những năm 2000,ợdữliệuâmthầmmànhộnnhịptrongthờiAIbùngnổbao the thao 24h Photobucket là website lưu trữ hình ảnh hàng đầu thế giới, với hơn 70 triệu người dùng, chiếm gần một nửa thị trường ảnh trực tuyến ở Mỹ.
Ngày nay, theo Similarweb, Photobucket chỉ còn hai triệu người dùng thường xuyên. Song, cơn sốt AI tạo sinh đang mang lại cho công ty sức sống mới. CEO Ted Leonard cho biết đang đàm phán với nhiều công ty công nghệ để cấp phép cho 13 tỷ ảnh và video của Photobucket, phục vụ đào tạo mô hình ngôn ngữ lớn (LLM). Giá mỗi ảnh tùy thuộc bên mua và loại nội dung được tìm kiếm, dự kiến từ 0,05 đến 1 USD và từ 1 USD mỗi video.
“Họ thậm chí còn muốn mua hơn một tỷ video, nhiều hơn cả những gì chúng tôi có”, Leonard nói.
“Cơn sốt tìm vàng”
Các công ty vận hành LLM như OpenAI, Meta, Google, Microsoft ban đầu sử dụng nguồn dữ liệu khổng lồ, miễn phí và công khai được thu thập từ Internet. Tuy nhiên, khi đối mặt với hàng loạt vụ kiện bản quyền, cũng như việc dịch AI thu phí đã đi vào triển khai, họ cần một khối lượng dữ liệu bản quyền khổng lồ.
Đi kèm với đó là hoạt động giao dịch ngầm về mọi loại dữ liệu, từ nhật ký trò chuyện đến ảnh cá nhân bị “lãng quên” từ lâu trên các diễn đàn, mạng xã hội cổ xưa.
Luật sư Edward Klaris từ Klaris Law cho biết những gã khổng lồ công nghệ đang sốt sắng tìm kiếm những người nắm bản quyền dữ liệu của những “nội dung riêng tư mà không thể loại bỏ” trong quá trình thu thập dữ liệu và huấn luyện AI. Hãng luật này đang tư vấn cho một số khách hàng mua bản quyền nội dung và cấp phép lưu trữ ảnh, phim, sách phục vụ đào tạo AI với giá hàng chục triệu USD.
Business Research Insightsước tính giá trị thị trường mua bán dữ liệu cho AI hiện ở mức 2,5 tỷ USD và sẽ tăng lên 30 tỷ USD trong vòng một thập kỷ.
Meta, Google, Amazon và Apple đều có thoả thuận với nhà cung cấp hình ảnh Shutterstock. Nguồn tin của Reuterscho hay, giá trị các hợp đồng rơi vào khoảng từ 25 triệu USD đến 50 triệu USD. Những công ty AI nhỏ hơn cũng không đứng ngoài cuộc chơi khiến chợ dữ liệu càng thêm nhộn nhịp suốt hai tháng qua.
Freepik, đối thủ của Shutterstock, cũng cho biết họ có thoả thuận với hai công ty công nghệ lớn, cấp phép phần lớn kho lưu trữ 200 triệu hình ảnh với mức giá từ 0,02 USD đế 0,04 USD mỗi hình ảnh. CEO Joaquin Cuenca Abela tiết lộ còn có thêm 5 giao dịch tương tự nhưng từ chối tiết lộ danh tính bên mua.
OpenAI, một trong những khách hàng đầu tiên của Shutterstock, cũng đã ký thoả thuận cấp phép với ít nhất bốn tổ chức xuất bản tin tức bao gồm AP, Axel Springer và Thomson Reuters.
Ngành công nghiệp dữ liệu AI
Ngành công nghiệp dữ liệu AI chuyên dụng đang dần định hình. Defined.ai, trụ sở Seattle đang cấp phép dữ liệu cho một loạt công ty bao gồm Google, Meta, Apple, Amazon và Microsoft.
Giá cả khác nhau tùy theo người mua và loại nội dung, nhưng CEO Daniela Braga cho biết các công ty thường sẵn sàng trả từ 1 đến 2 USD cho mỗi hình ảnh, 2 đến 4 USD cho mỗi video dạng ngắn và 100 đến 300 USD mỗi giờ cho phim dài hơn. Trong khi đó, giá thị trường cho văn bản là 0,001 USD mỗi từ.
Defined.ai cho biết, các tập dữ liệu “có nguồn gốc hợp pháp” do có sự đồng ý từ những người chủ sở hữu và đã loại bỏ thông tin nhận dạng cá nhân. Công ty cũng chia sẻ khoản thu nhập với các nhà cung cấp nội dung. Sau đó, các nhà cung cấp nội dung trả chủ sở hữu bản quyền 20-30% tổng giá trị giao dịch.
Theo một nhà cung cấp dữ liệu trụ sở Brazil, những hình ảnh đắt giá nhất trong danh mục thường là hình ảnh đào tạo hệ thống AI chặn nội dung bạo lực. Do đó, công ty thu thập hình ảnh về hiện trường vụ án, bạo lực và các cuộc phẫu thuật chủ yếu từ cảnh sát, phóng viên ảnh tự do và sinh viên y khoa ở những khu vực như Nam Mỹ và châu Phi.
Rủi ro quyền riêng tư người dùng
Các chuyên gia nhận định, việc đưa những "tên tuổi Internet cũ" như Photobucket trở lại, sử dụng nội dung làm nhiên liệu cho đào tạo AI có thể gây ra một số rủi ro nghiêm trọng, đặc biệt về quyền riêng tư của người dùng.
"Có nghĩa là, những bức ảnh hoặc nội riêng tư của một người được đăng cách đây vài thập kỷ có thể xuất hiện trở lại trong kết quả đầu ra của AI mà không cần thông báo hoặc có sự đồng ý rõ ràng", một chuyên gia cho biết.
Braga của Defined.ai cho biết công ty tránh mua nội dung từ các đơn vị mang tính "nền tảng" như Photobucket. Thay vào đó, công ty lấy nguồn ảnh trên mạng xã hội do KOL tạo ra - những người có yêu cầu rõ ràng hơn về quyền cấp phép.
"Tôi thấy lấy nội dung từ nền tảng cũ rất rủi ro", Braga nói. "Nếu có AI nào đó tạo ra thứ gì đó giống với hình ảnh của một người chưa bao giờ đồng ý chia sẻ, đó là một vấn đề".
Photobucket không phải là nền tảng cũ duy nhất bán nội dung cho công ty AI. Automattic, công ty mẹ của Tumblr, tháng trước cũng cho biết đang chia sẻ nội dung với "công ty AI được chọn lọc". Trong tháng 2, Reddit cũng đạt được thỏa thuận với Google về việc huấn luyện AI.
Dù vậy vào tháng 3, Reddit nói quyết định cấp phép dữ liệu cho bên thứ ba đào tạo AI khiến công ty trở thành mục tiêu điều tra của Ủy ban Thương mại Liên bang Mỹ. Mạng xã hội thừa nhận rằng hành vi này có thể vi phạm các quy định về quyền riêng tư và sở hữu trí tuệ đang có
Facebook âm thầm bán tin nhắn người dùng cho Netflix hàng thập kỷTrong suốt gần 10 năm, Facebook đã âm thầm bán tin nhắn người dùng cho Netflix, giúp dịch vụ xem truyền hình theo yêu cầu nắm rõ thói quen và sở thích của khách hàng.很赞哦!(91)
相关文章
- Kèo vàng bóng đá Tottenham vs Leicester, 21h00 ngày 26/1: Khách có điểm
- Xuân Lan không còn bận tậm với những lời đặt điều, vu khống
- Ngọc Quyên tự tin xuất hiện cùng xe đẹp
- Người dân thành phố lớn tiếp tục dẫn dắt thương mại điện tử
- Nhận định, soi kèo Zamalek vs El Gouna, 22h00 ngày 27/1: Trở lại mạch thắng lợi
- MV Ngân nga Việt Nam
- Phụ huynh bị trường nhắc nhở vì cho con mang socola tới trường
- Phép màu: Đôi cá vàng sống 135 ngày trong đống đổ nát
- Soi kèo góc Tottenham vs Leicester, 21h00 ngày 26/1
- Tăng Duy Tân 'Bên trên tầng lầu' làm huấn luyện viên show thực tế
热门文章
站长推荐
Nhận định, soi kèo Bali United vs Borneo, 19h00 ngày 28/1: Sức ép ngàn cân
Nhiều nhà đầu tư tiền số lo lắng trước những động thái tụt giảm liên tục của các loại tiền mã hóa. (Ảnh: Trọng Đạt) Việc Ethereum mất tới 11,5% giá trị trong ít giờ qua khiến nhiều người không khỏi bất ngờ. Đây là thời điểm Ethereum vừa thực hiện thành công đợt hard fork Bellatrix.
Về bản chất, hard fork là một sự thay đổi sâu rộng của một mạng lưới Blockchain. Mỗi đợt hard fork sẽ yêu cầu tất cả các nút mạng phân tán đang chạy phải chuyển sang phiên bản mới.
Đợt hard fork mới nhất của Ethereum có tên gọi Bellatrix. Đây là bước đầu tiên trong tiến trình The Merge - một bản nâng cấp quan trọng của mạng Ethereum.
The Merge dự kiến diễn ra vào ngày 13/9 tới đây. Sự kiện này đánh dấu việc mạng Ethereum chính thức chuyển đổi từ cơ chế đồng thuận Proof-of-Work (PoW - Bằng chứng công việc) sang cơ chế Proof-of-Stake (PoS - Bằng chứng cổ phần).
Khi bản nâng cấp này hoàn thành, chuỗi Ethereum 2.0 sẽ ra đời, đánh dấu một bước tiến quan trọng của mạng lưới. Do vậy, nhiều dự đoán đã cho rằng Ethereum và các token thuộc hệ sinh thái này sẽ tăng mạnh trong tháng 9, vượt khỏi tầm ảnh hưởng của Bitcoin.
Với đợt giảm giá lần này của Bitcoin, có thể thấy Ethereum vẫn chưa thoát khỏi sức khống chế của đồng tiền mã hóa số 1 thế giới. Bằng chứng là trong khi giá Bitcoin chỉ tụt 1.300 USD (khoảng 6,5%), giá Ethereum đã mất tới 190 USD, tương đương 11,5% giá trị.
Trọng Đạt
">Bitcoin mất mốc 19.000 USD, giá Ethereum giảm sốc
- - Hà Hồ khiến nhiều người bất ngờ khi thể hiện khả năngchơi đàn rất "nuột".
Cường Đô La âm thầm ‘sát cánh’ Hồ Ngọc Hà
Hồ Ngọc Hà tóc xù quyến rũ, Lệ Quyên dáng thon đầy gợi cảm
Hồ Ngọc Hà đẹp tựa Nữ thần tình yêu
Thăm quan ngôi nhà của Hồ Ngọc Hà
Hồ Ngọc Hà: Yêu Cường vì anh là người tốt
Hồ Ngọc Hà: ‘Tôi đâu phải cao thủ võ lâm’
Hồ Ngọc Hà tự hào khoe con trai
Hồ Ngọc Hà sốc nhưng đẹp bởi váy ngắn bằng tóc
">Hà Hồ quyến rũ bên cây đàn dương cầm
Ngạc nhiên với nhà chỉ 700 USD
Soi kèo góc Club Necaxa vs Cruz Azul, 10h05 ngày 29/1
Chữ "những" thêm vào trước logo "Bức Tường" trong tựa bộ phim tài liệu này là một cụm từ đa nghĩa chỉ ban nhạc Bức Tườngở giai đoạn hậu Trần Lập. Trên hành trình phía trước, họ vừa phải gìn giữ một Bức Tường với di sản âm nhạc cũ đã cùng Trần Lập tạo ra nhưng hoàn cảnh và dòng chảy thời đại lại đòi hỏi tất cả phải tạo ra một Bức Tường mới.Bức Tườnglà một ban nhạc rock đi lên từ phong trào văn nghệ sinh viên. Bằng nhiệt huyết và đam mê tuổi trẻ cùng sự dẫn dắt của thủ lĩnh Trần Lập, họ đã truyền cảm hứng cho nhiều thế hệ thanh thiếu niên Việt Nam trong giai đoạn đất nước vừa mới hội nhập, vẫn còn rất nhiều những khó khăn thử thách. Ban nhạc để lại những dấu ấn không thể đẹp hơn trên chặng đường âm nhạc gần 30 năm của mình.
Vắng Trần Lập, Bức Tường vẫn là Bức Tườngnhưng lại rất mới. Dấu ấn minh chứng cho nỗ lực đi tiếp của ban nhạc chính là liveshow Trở về diễn ra vào ngày 17/4/2021 tại Đại học Xây dựng, cái nôi sinh ra Bức Tường. Những khoảnh khắc xúc động, câu chuyện hậu trường về show diễn đặc biệt này cũng được ghi lại trong bộ phim.
Bên cạnh những nhân vật chính là 4 thành viên của ban nhạc Bức Tường,phim còn có sự góp mặt của MC Lại Văn Sâm - người lưu giữ nhiều kỷ niệm về Trần Lập và Bức Tường,MC Thùy Minh, nhạc sĩ Thanh Phương, thủ lĩnh ban nhạc Microwave Tùng Trần, ca sĩ Phạm Anh Khoa, cựu thành viên của ban nhạc Bức Tườnggồm Trần Nhất Hoàng, Nguyễn Hoàng, Trần Hồng Trường, nhiều nhân vật từng làm việc với ban nhạcBức Tườngkể từ khi mới thành lập cho đến nay cùng những người hâm mộ, bạn trẻ yêu thích âm nhạc của Bức Tường.
Những Bức Tường là phim tài liệu đầu tiên được Truyền hình K+ sản xuất, ra mắt trên kênh K+ Cine vào 24/9 tới.
Quỳnh An
">
MC Lại Văn Sâm xuất hiện trong phim tài liệu về Bức Tường hậu Trần Lập
(Ảnh: Online Tech Tips) Những cáo buộc của Zatko là một lời nhắc nhở mới đối với chuyên gia nghiên cứu mạng xã hội Sandra Matz về việc chúng ta thi thoảng chia sẻ dữ liệu một cách vô độ như thế nào. “Nghe có vẻ đơn giản, nhưng bất kỳ thứ gì bạn quẳng lên mạng, đừng mong chúng có thể riêng tư như cũ. Thu hồi thứ gì đó từ Internet, bấm nút reset là gần như không thể”.
Tại Mỹ, lịch sử tìm kiếm, dữ liệu địa điểm, tin nhắn… đều có khả năng trở thành bằng chứng chống lại ai đó nếu họ đang muốn tìm đến các dịch vụ nạo phá thai. Cuối tháng 6, Tòa Tối cao Mỹ bỏ quyền phá thai gây ra làn sóng tranh cãi dữ dội.
Vào tháng 7, Meta – công ty mẹ Facebook – hứng chịu chỉ trích nặng nề sau khi nhà hành pháp đã sử dụng các tin nhắn gửi qua Messenger để bắt giữ hai mẹ con phá thai bất hợp pháp.
Ravi Sen, nhà nghiên cứu bảo mật và Giáo sư tại Đại học Texas A&M, cho rằng nhà hành pháp và các tổ chức khác với nguồn lực và công cụ, chuyên môn có thể khôi phục dữ liệu đã xóa trong vài tình huống nhất định. Theo Giáo sư, nhiều người không biết cuối cùng dữ liệu của họ đi đâu. Bất kỳ nội dung nào – dù là email, bình luận mạng xã hội hay tin nhắn – về cơ bản đều lưu trên thiết bị người gửi, người nhận và máy chủ mà công ty sử dụng. Lý tưởng nhất là nội dung do người dùng tạo ra được phép xóa nó và nó sẽ biến mất khỏi cả 3 địa chỉ trên. Nhưng thông thường, điều đó không dễ như vậy.
Bạn có thể liên hệ với các công ty để yêu cầu họ xóa dữ liệu khỏi máy chủ nhưng không phải ai cũng đi đến bước này. Khả năng phục hồi một tin nhắn đã xóa từ thiết bị của người dùng giảm dần theo thời gian.
Theo nhiều chuyên gia bảo mật, cách tốt nhất để kiểm soát dữ liệu trực tuyến là dùng các ứng dụng mã hóa đầu cuối. Một điều quan trọng khác là quản lý cài đặt sao lưu đám mây để bảo đảm dữ liệu riêng tư từ các dịch vụ mã hóa không thể truy cập từ những nơi khác.
Dù vậy, ngay cả với một người thận trọng nhất, một khi đưa gì đó lên mạng, “về cơ bản bạn đã mất quyền kiểm soát nó”, Matz nhận xét. Đó là vì nếu Twitter xóa bài viết, hay bạn xóa bài viết từ Facebook, ai đó cũng có thể đã sao chép bài viết và lưu lại.
Vì thế, Matz khuyến nghị mọi người nên chú ý về những gì chia sẻ trên các nền tảng trực tuyến. Nghe có vẻ bi quan nhưng bà cho rằng tốt hơn nên cảnh giác cao. “Hãy giả định mọi thứ bạn đưa ra đều có thể bị ai đó sử dụng và tồn tại vĩnh viễn”, bà nói.
Du Lam (Theo CNN)
Mỗi người dân Đà Nẵng có kho dữ liệu riêng trên nền tảng công dân số My Portal
Với nền tảng công dân số My Portal, mỗi người dân Đà Nẵng có 1 kho dữ liệu riêng, có thể tự chỉnh sửa và bổ sung phục vụ các hoạt động giao dịch với chính quyền thành phố, doanh nghiệp cung cấp dịch vụ công.
">Vì sao xóa thứ gì đó trên Internet lại khó đến thế?
MC Vân Hugo công khai ảnh hạnh phúc với bạn trai mới. Ảnh: FBNV Cách đây ít phút MC Vân Hugo đăng tải bức ảnh tình cảm đầu tiên với bạn trai với chú thích: "Simple love" (Tình yêu giản đơn) và nhận vô số lời chúc mừng của bạn bè như diễn viên Minh Hương, Quỳnh Nga, MC Thụy Vân... nhiều người mong sớm nhận được tấm thiệp cưới của nữ MC.
Trước đó dù công khai mình đã được bạn trai cầu hôn và hiện đã chuyển về sống chung với anh trong TP.HCM nhưng MC Vân Hugo ít chia sẻ về người đàn ông của mình. Những bức ảnh cô đăng tải trên trang cá nhân chủ yếu chụp sau lưng hoặc làm mờ mặt "đối tác". Đây là lần đầu tiên cô đăng ảnh công khai diện mạo của bạn trai.
Hình ảnh MC Vân Hugo trong chuyến du lịch cùng bạn trai gần đây. Ảnh: FBNV Chia sẻ trong chương trìnhVui sống mỗi ngàytrên VTV3 trưa 5/10, MC Vân Hugo lần đầu kể nhiều câu chuyện về hành trình tình yêu với bạn trai hiện tại. Cô nói bị anh hoàn toàn chinh phục vì sự quan tâm và bền bỉ. Trước khi MC Vân Hugo cùng con trai chuyển vào TP.HCM sống cùng anh, bạn trai gần như tuần nào cũng bay ra Hà Nội để gặp MC Vân Hugo, ngay cả đợt dịch bệnh. Thậm chí có ngày sáng MC Vân Hugo vừa bay ra Hà Nội thì tối anh lập tức lên máy bay ra với người yêu.
MC Vân Hugo nói bạn trai đã tìm hiểu mọi sở thích và thói quen của cô từ chị gái của MC Vân Hugo nên hiểu cô trong lòng bàn tay. Mỗi khi cô vào Sài Gòn anh sẵn sàng đến đón cô đi ăn sáng, ăn trưa rồi ăn tối. MC Vân Hugo cũng cho biết người bạn trai hiện tại của cô cũng đã có con riêng từ cuộc hôn nhân trước. Tuy nhiên nữ MC không gặp khó khăn trong việc hòa nhập với bọn trẻ bởi xưa nay cô vốn rất yêu trẻ con và tự tin luôn có sức hút đặc biệt với lũ trẻ.
MC Vân Hugo tìm được bình an bên người đàn ông thứ hai. Nữ MC nói trước đây cô nghĩ rằng nuôi dạy con cái chỉ cần có tình yêu và sự chiều chuộng là đủ nhưng từ khi gặp anh, một chuyên gia trong lĩnh vực giáo dục, cô đã biết cách nuôi dạy con một cách khoa học hơn. Khi MC Lương Mạnh Hải hỏi về kế hoạch làm đám cưới, MC Vân Hugo nói đáng lẽ đám cưới đã diễn ra nhưng vì dịch bệnh nên hoãn lại và sẽ được tổ chức vào một thời gian thích hợp.
MC Vân Hugo trong phim 'Lựa chọn số phận'
Quỳnh An
MC Vân Hugo tái hôn
Dù chưa tổ chức đám cưới nhưng MC Vân Hugo đã cùng con trai chuyển vào TP.HCM để ở cùng chồng sắp cưới.
">MC Vân Hugo công khai ảnh hạnh phúc với bạn trai mới