Reddit FTC vyšetrovanie generatívnych AI tréningových dát

Technologická platforma Reddit tvrdí, že Federálna obchodná komisia vyšetruje svoje dohody o licencovaní údajov spoločnostiam s umelou inteligenciou, ktoré sa snažia trénovať svoje modely.

Spoločnosť zverejnila vyšetrovanie v podaní SEC archivácia V piatok popoludní s tým, že správu o vyšetrovaní dostali vo štvrtok.

„Dňa 14. marca 2024 sme dostali list od Federálnej obchodnej komisie (ďalej len „FTC“), ktorý nás informoval, že pracovníci FTC viedli neverejné vyšetrovanie zamerané na náš predaj, udeľovanie licencií alebo zdieľanie obsahu vytvoreného používateľmi s tretími strany na trénovanie modelov AI,“ uvádza sa v dokumente SEC. „Vzhľadom na nový charakter týchto technológií a obchodných dohôd nás neprekvapuje, že FTC prejavila záujem o túto oblasť. Nemyslíme si, že sa zapájame do nejakých nečestných alebo klamlivých obchodných praktík. V liste sa uvádzalo, že zamestnanci FTC mali záujem stretnúť sa s nami, aby sa dozvedeli viac o našich plánoch, a že FTC má v úmysle vyžiadať si od nás informácie a dokumenty, keďže vyšetrovanie pokračuje.

Reddit minulý mesiac podal formulár S-1 SEC, čo je kľúčový krok pred spustením široko očakávanej počiatočnej verejnej ponuky (IPO). Archivácia odhalili množstvo detailov o spoločnosti vrátane veľkého podielu (približne 9 %), ktorý vlastní generálny riaditeľ OpenAI Sam Altman, a prezentácie pre investorov, ktorá sa vo veľkej miere spoliehala na potenciálne príjmy z Generatívna AI školenia, pričom si všimne, že dohoda v hodnote 203 miliónov dolárov by mala byť uzavretá so spoločnosťou Google.

„Náš obsah je obzvlášť dôležitý pre umelú inteligenciu („AI“) – je kľúčovou súčasťou toho, koľko popredných veľkých jazykových modelov („LLM“) bolo vyškolených,“ napísala spoločnosť v S-1. „Údaje Reddit neustále rastú a obnovujú sa, ako používatelia konverzujú. Keď sa svet stáva viac založený na údajoch, ponúkame riešenia zamerané na človeka a skúsenosti. Očakávame, že naša výhoda v oblasti údajov a duševné vlastníctvo budú aj naďalej kľúčovým prvkom pri formovaní budúcich LLM.“

Spoločnosť v piatok uviedla, že upravuje svoje rizikové faktory, aby ďalej zohľadňovala vyšetrovanie FTC:

„Regulačné záväzky môžu byť dlhé a nepredvídateľné,“ uvádza sa v dokumente. „Akákoľvek regulačná angažovanosť nám môže spôsobiť značné náklady a je možné, že akákoľvek regulačná angažovanosť by mohla mať za následok poškodenie dobrého mena alebo pokuty, spôsobiť, že prestaneme alebo upravíme naše produkty, služby, funkcie alebo funkcie, bude od nás vyžadovať zmenu našich zásad alebo praktiky, odvádzajú manažment a iné zdroje z nášho podnikania alebo inak nepriaznivo ovplyvňujú naše podnikanie, výsledky operácií, finančnú situáciu a vyhliadky.“

Licenčné údaje pre generatívne modely AI sa v Hollywoode stali horúcou témou, pretože hollywoodske filmy a fotografie môžu byť cenné, keďže sa video a fotomodelky vyvíjajú. Podobne údaje zo správ sa považujú za užitočné pre LLM, ktorí chcú mať informácie v reálnom čase.