genkendelses program!?

Software d.  16. oktober. 2009, skrevet af anru2007
Vist: 1308 gange.

anru2007
 
Elitebruger
Tilføjet:
16-10-2009 18:13:03
Svar/Indlæg:
5891/423
_Hey..

ville spørge om der overhovedet findes et program der kan tage 2 video, og finde evt. to ting på samme video, som den kan genkende, eksempelvis et par sneakers.... hmmmm lad mig forklare det sådan her:

video et:

en man spiller basket, han er mørk i huden og bruger nogle air jordan sneakers.

video to:

en mand spiller basket er lys i huden, bruger de samme sko som manden med den mørkehud.



Programmet skal så kunne finde ud af at sige: video 1 og 2 har disse fællestræk, eksempelvis at de brugte sko er ens?

Er bare nyskæring om, at sådanne programmer findes?

eller er vi slet ikke så high tec endnu 😀


V.H
Anru
Ubehage
 
Superbruger
Tilføjet:
16-10-2009 18:38:11
Svar/Indlæg:
905/100
Jeg tror det findes.. Men det er vist kun CIA og andre, som har pengene til det 🙂


gabbadoo
 
Elitebruger
Tilføjet:
16-10-2009 19:33:59
Svar/Indlæg:
3065/208
det er vel i princippet simpelt at lave, hvis du har et rimeligt afgrænset udgangspunkt som fx en sko. Skoen er vel hvid og to-dimensionelt proportioneret, så koden vil være genkendelig for programmet der skal analysere video 2. Jo mindre detaljer der skal genkendes, jo sværere bliver det vel.


gabbadoo
 
Elitebruger
Tilføjet:
16-10-2009 19:41:00
Svar/Indlæg:
3065/208
Jeg tror i øvrigt visse spil-studioer bruger noget software til at 3d-modellere ud fra 2d-billeder, så de fx kan generere et tre-dimensionelt landskab ud fra et ganske almindeligt billede fra et digitalt kamera, og så bliver det jo interessant, fordi visse elementer, altså et træ eller en sko, derved kan isoleres.

EDIT: Jeg googlede lige lidt og rendte ind i et program der hedder Mystica: http://www.dawntec.com/mystica... - under features er der bl.a. "builds 3D world from 2D image, input either Mystica images or arbitrary images through clipboard"


Svaret blev redigeret 1 gang, sidst af gabbadoo d. 16-10-2009 19:43:49.


anru2007
 
Elitebruger
Tilføjet:
16-10-2009 20:01:34
Svar/Indlæg:
5891/423
tak for svarene, men programmet skal selv kunne finde sammenlignerne desværre 😕


NoNig
 
Elitebruger
Tilføjet:
16-10-2009 21:47:24
Svar/Indlæg:
23132/740
-> #0

Velkommen til matematisk modellering 😎


anru2007
 
Elitebruger
Tilføjet:
16-10-2009 22:29:36
Svar/Indlæg:
5891/423
#5 i know, men tænkte at det burde være noget virkelig krævende noget og umuligt selv at tage fat om, så hvis der var programmer til det, som os dødelig har adgang til?

#5 kvantemekanikken ville være dejligt lige nu 🙂


Zorba
 
Superbruger
Tilføjet:
17-10-2009 03:04:00
Svar/Indlæg:
1142/59
#6 jeg arbejder i øjeblikket på et program som, udover en masse andet, kan klare det du taler om. Det er dog ikke klar til brug og kræver derudover en væsentlig stor del serverkræfter. Dette skyldes, at dine, i dette tilfælde sneakers, ikke altid vises med samme rotationsvinkel etc og det er derfor nødvendigt at sammenligne på mere end bare formen, da man er nødt til også at sammenligne med roterede modeller. Det hjælper selvfølgelig med matematiske algoritmer, men selv der er det utroligt krævende især med så store mængder data. Du skal heller ikke forvente at se mit program (laves dog også med andre) foreløbig.


anru2007
 
Elitebruger
Tilføjet:
17-10-2009 17:02:27
Svar/Indlæg:
5891/423
#7 😲


NoNig
 
Elitebruger
Tilføjet:
17-10-2009 19:18:42
Svar/Indlæg:
23132/740
-> #7

Det lyder ekstremt spændende. Selv sidder jeg og fusker lidt med nogle hypoteser, hvor man netop ikke behøver store mængder data, men blot nogle avancerede algoritmer der kan "genkende" former og farver.

Jeg har en god datalogven, der hjælper mig lidt med det, men det er et ekstremt spændende område, der åbner en masse døre 🙂


#10
PK
 
Elitebruger
Tilføjet:
17-10-2009 21:30:12
Svar/Indlæg:
931/181
#7 det lyder da sweet... jeg lægger da gerne en gang kræfter til test af sådan et program :D

#9 frækt... kan du sige gogogo vi vil se det færdigt? :D


Zorba
 
Superbruger
Tilføjet:
18-10-2009 02:12:58
Svar/Indlæg:
1142/59
#9 det er godt at se at der er andre der også roder lidt med det. Jeg giver dig helt ret i at det er et spændende område, men jeg må også sige at det er ekstremt krævende. Måden jeg har lavet kernen i "mit" system, er ved at indbygge en form for kalibrering (test af hardware performance og detaljegraden defineres ud fra dette). Det har hjulpet meget på hastigheden, men det skyldes jo også at den undlader at gå alt for meget i dybden med analysen medmindre hardwaren er tilstrækkelig. Dette skyldes, at formålet med projektet udelukkende er til en AI kerne som godt må fejle på menneskelig vis. Vi mennesker kan jo heller (med vores nuværende hjerner/samfund) lægge mærke til alting på en gang. Det er derfor heller ikke nødvendigt, at en AI kerne til en robot skal kunne det.

Jeg vil slet ikke give en ETA på noget som helst da projektet er utroligt krævende og jeg har ikke ligefrem en stor mængde tid til at kode. Det er dog helt sikkert at projektet ikke droppes, men det tager nok en del år endnu 🙂


#12
1EaR
 
Elitebruger
Tilføjet:
18-10-2009 02:32:29
Svar/Indlæg:
5750/124
#11 sweet. Hvad er egentlig din baggrund for det? Altå, lidt om det er noget du arbejder med til dagligt, eller om det fritids noget, og om du har uddannelse der kan svare lidt inden for emnet 😳


NoNig
 
Elitebruger
Tilføjet:
18-10-2009 10:04:12
Svar/Indlæg:
23132/740
-> #11

Jeg har forsøgt mig med tre niveauer. En lommeregner, end alm. desktop PC og en "super"-computer. Eftersom jeg ikke er datalog eller på nogen måde smart inden for programmering, kan jeg ikke komme med de korrekte tekniske termer.

Men min idé er, at den eneste foruddefinerede kode i den "kunstige intelligens" skal være evnen til at lære. Derefter skal den (computeren) selv kunne sortere og udforme en slags ligning der siger: "Sådan her ser en kat, højest sandsynligt, ud" - lidt som en søgning på en hjemmeside, hvor man får svarene præsenteret med faldende korrekthed (90 %, 66 %, 25 %, 7 % osv.) - og så skal den "lære", at det korrekte svar nok oftest er det mest sansynlige (eller omvendt: At det mest sandsynlige svare, oftest er det mest korrekte).

Dvs. jeg vil give computeren mulighed for selv at udforme sin programmering, og det er pt. deri jeg sidder lidt fast.

Jeg er ikke en mand med evner, men en mand med idéer. Heldigvis kender jeg folk med evner, og så har vi rig mulighed for at sparre. Men jeg er heller ikke helt grøn på området. I 8. klasse, i elektronik, lavede jeg en robot ud af en walkman, der selv kunne navigere og gå udenom objekter der stod foran den/det.

- Mest fordi jeg kunne, men også for at overbevise min lærer om, at den slags funktioner ikke krævede så meget programmering, elektronik, enkodere osv.

Vi indgik et væddemål, og jeg proklamerede, at hvis jeg i den efterfølgende time ikke kunne fremstille en robot der kunne gå af sig selv, og gå udenom objekter der stod i vejen for den, fik han lov til at give mig 03 resten af året. Og jeg havde kun 2x 45 minutter til at lave den.

Ugen efter, brugte vi ca. 80 minutter på at studere den robot jeg lavede på 5 minutter - og det er nok unødvendigt at nævne, at jeg ikke fik 03 resten af året.

Min idé skulle så være, at vi i forvejen komplicerer tingene alt for meget. På samme måde som små børn skal lære at gå selv - ved at vælte - mener jeg at en robot skal lære at gå selv. Du skal blot give den idéen om, at "vælter jeg, er det ikke godt" - og når den så vælter, skal den sige til sig selv: "Det var en dårlig beslutning, så den gentager vi ikke" - på samme måde, som små børn der brænder sig på en tændstik.

Samme idé vil jeg arbejde ud fra, med hensyn til en kunstig intelligens. I starten vil jeg prøve at lade den genkende ord, og opbygge et ordforråd - det tager en helvedes tid, men jeg tror at det fører mig i den rigtige retning.

Derefter vil jeg give den "øjne" (enten i form af et kamera eller blot 'vise' den JPEG filer), hvor den så skal kunne binde ord på de objekter den ser foran sig. På samme måde som billederne, skal det være samme form for logik der leder den til at arbejde ud fra en sandsynlighed, således den er i stand til at isolere objekter i billedfladen. På samme måde som vi ser en rød firkant på en hvid væg. Så skal den sortere "hvid væg" fra, og se den røde firkant

... - agtigt.

Men der hvor jeg sidder lidt fast, lige nu, er det med at den selv skal kunne opbygge en formel for "pizza", en formel for "kat" osv. Men det er blot et teknisk problem, for resten har vist sig at virke ret godt.


Svaret blev redigeret 1 gang, sidst af NoNig d. 18-10-2009 10:06:37.


Zorba
 
Superbruger
Tilføjet:
18-10-2009 14:51:38
Svar/Indlæg:
1142/59
#12 det er pt. fritid, men regner med at tage nogle kurser indenfor området på DTU. Jeg skal dog lige igennem de kedelige kurser først 🙂

#13 jeg kan læse, at du faktisk tænker på samme måde som vi gør med det her projekt. Vi har dog valgt at gå skridtet videre og derfor implementeret både øjne, ører og mund. Det har også vist sig at fungere efter hensigten, men der er stadig problemer med selve "nysgerrigheden". Robotten kan nemlig ikke finde ud af at underholde sig selv og går derfor nærmest i stå så snart den har reageret på noget. Det er det der er vores største problem da vi meget gerne så, at robotten lærte på egen hånd. Den kan allerede genkende objekter og tekst, men den kan ikke finde ud af at sammensætte en sætning som giver mening. Dette skyldes primært, at hardwaren ikke er tilstrækkelig til at vi kan lære den alting. Det er mest pladsmangel fremfor CPU/RAM mangel der sætter grænsen for os. Dette er dog noget som gerne skulle løses i løbet af 2010, når vores data optimering er på plads. Det tager bare lidt tid at lave da vi alle har enten studie, arbejde eller begge dele.