Skip to content
Metoodika

Kodulabori hindamise raamistik

Iga Kodulabori projekt hinnatakse üheksa dimensiooni järgi. See pole samm-sammu juhendamine—see on raamistik, mida rakendan, et mõõta, mis tegelikult toimus päriselt töö juures. Vaatan probleemi, AI lähenemist, seotud inimtegevust, võrdlust traditsioonilist meetodit kasutades ja kas see toimiks ka kellelgi teisel. Iga dimensioon räägib luguse osa. Koos annavad nad pildi, kas AI tõesti aitas.

1

Probleem

Mis tuli lahendada, kellele ja miks see tähtsus oli. Konkreetne töövoog, kitsaskohad ja kuidas edukas lahendus välja näeks.

2

AI lähenemisviis

Millised AI tööriistadega valisin ja miks just need. Kuidas neid seadistasin—millised otsesõnalised käsud, parameetrid, integreerimispunktid. Kus otsustasin mitte automatiseerida.

3

Inimtegevus

Mitu tundi see kokku võttis. Jaotus: kui palju oli AI-ga assisteeritud tööd (AI-ga koos töötamine) versus puhtalt käsitsi tehtud tööd (AI ei saanud aidata). Lisada ka kogu tegevus—seadistamine, iteratsioon, parandused, läbivaatamised.

4

Traditsiooniline võrdlus

Kui kaua see oleks võtnud ilma AI-ta—puhtalt inimjõud? Kasuta tegelikke andmeid, kui olemas, või hoolikat hindamist sarnasel tööl põhinedes.

5

Kiirenemise koefitsient

Traditsiooniline jõupingutus jagatud AI-ga assisteeritud jõupingutusega. Kui traditsiooniline oleks võtnud 40 tundi ja AI-ga assisteeritud 12 tundi, on koefitsient 3,3x.

6

Kvaliteet

Kas AI-ga assisteeritud väljund on sama hea kui ilma AI-ta oleks olnud? Mõnel viisil parem? Kehvem? Mis tuli käsitsi parandada?

7

Probleemid ja piirangud

Mis läks valesti. Kus AI ebaõnnestus. Millised erijuhud ilmnesid. Mis vajasid inimsekkumist. Millega peaksid teised inimesed arvestama?

8

Korratavuse skoor

Kas keegi teine saaks täpselt sama teha samade tööriistadega ja saada sarnase tulemuse? Hinda 1–5 (1 = ainult selle konkreetse juhu jaoks, 5 = laialt kasutatav). Selgita hindamist.

9

Lõppverdikt

Kokkuvõttes: kas AI aitas? Kui palju? Kas teised peaks seda proovima? Mida teeksin teisiti? Kellele see on ja kes peaks seda vältima?

Miks see raamistik on vajalik

Tehisintellekti maiust on kõikjal. Väideid on lihtne teha. Andmeid on harv. Ehitasin selle raamistiku, kuna on erinevus tööriista vahel, mis tundub hetkel kasulik, ja tööriista vahel, mis mõõdetavalt parandab tegelikku tööd. Mõõdan üheksat dimensiooni—probleem, lähenemisviis, jõupingutus, võrdlus, kiirenemise koefitsient, kvaliteet, probleemid, korratavus ja lõppverdikt—sest see on ainus viis teada, kas AI tõesti aitas või lihtsalt muljet avaldas. Dokumenteerin, mis läks valesti. Jagan numbreid. See on, kuidas õpime.

Märkus andmeallikate kohta

Kõik andmed pärinevad päriselt töö pealt. Ajastuse logid tegelikest sessioonidest, märguandmete arvud API kutsetest, kvaliteedi hindamised töö tegijate poolt ja dokumenteeritud hetked, kus AI vajasid inimsekkumist. Pole patenteeritud mudeleid, pole künstlikke võrdlusaluseid. Iga dimensioon—tundide arv, kiirenemise koefitsient, korratavuse skoor—pärineb mõõtmisest, mitte arvamisest. Kui soovid tulemusi korrata, on sul numbrid käes.

Juhtumiuuring—mallpohja

Kui kirjutan juhtumiuuringut, vasutan iga nendele küsimustele. Võid kasutada sama struktuuri oma AI projektide dokumenterimiseks. Pealkirja kõrval olev küsimus on juhis—vastuta ausalt, kaasa numbrid ja ära peida rasked osad.

Probleem

Mis oli konkreetne ülesanne või töövoog? Kes seda tegi ja mis tegi selle keeruliseks? Kuidas nägi edukas lahendus välja?

AI lähenemisviis

Millised AI tööriistadega kasutasin? Miks just need? Kuidas sead neid seadistasin—millised õigused, parameetrid, integreerimispunktid? Kus otsustasin mitte automatiseerida?

Inimtegevus

Mitu tundi see kokku võttis? Jagamine: kui palju oli AI-ga assisteeritud (AI-ga koos töötamine) ja kui palju puhtalt käsitsi (AI ei saanud aidata)? Kaasa ka tegevuse kõik kulud—seadistamine, iteratsiooni, parandused, ülevaatused.

Traditsiooniline võrdlus

Kui kaua oleks võtnud ilma AI-ta—puhtalt inimese jõud? Kasuta tegelikke andmeid, kui saadaval, või hoolikat hindamist sarnasel varasemalt tehtud tööl põhinedes.

Kiirenemise koefitsient

Jagage traditsiooniline jõupingutus AI-ga assisteeritud jõupingutusega. Kui traditsiooniline oleks 40 tundi ja AI-ga assisteeritud 12 tundi, on koefitsient 3,3x.

Kvaliteet

Kas väljund on sama hea kui ilma AI-ta oleks olnud? Mõnel viisil parem? Teistel viisidel kehvem? Mida tuli käsitsi parandada? Millised kompromissid tegid?

Probleemid ja piirangud

Mis läks valesti? Millal AI ebaõnnestus? Millised erijuhud ilmnesid? Mis vajasid inimsekkumist? Millega peaksid teised arvestama?

Korratavuse skoor

Kas keegi teine saaks täpselt sama teha samade tööriistadega ja saada sarnase tulemuse? Hinda 1–5 (1 = ainult selle juhu jaoks, 5 = kõigile kasutatav). Selgita hindamist.

Lõppverdikt

Kokkuvõttes: kas AI aitas? Kui palju? Kas teised peaks seda proovima? Mida teeksin teisiti? Kellele see on, kes peaks seda vältima?

Andmete lisa

Loetelu kasutatud tööriistadest, märguandmete arvud, kulud, ajastuse ülevaatused, õigused (kui neid võib jagada) ja muud toorandmed, mis juhtumiuuring toetavad. Selle abil saavad lugejad kontrollida ja korrata.