Vēsture Idejas par intelektuālām mašīnām pazīstamas jau antīkajā mitoloģijā (grieķu skulptora Pigmaliona (Πυγμαλίων) no ziloņkaula izveidotā sievietes figūra). 5. gs. p. m. ē. Aristotelis (Ἀριστοτέλης) izstrādājis pirmo formālo deduktīvās spriešanas sistēmu (siloģismus). 3. gs. p. m. ē. izgatavotais papiruss, iespējams, satur pirmo zināmo ekspertu sistēmas aprakstu. 13.–18. gs. vērojama pirmo mehānisko dzīvnieku, “runājošo galvu” un citu mākslīgi radītu ierīču, kas spēj atdarināt dzīvu sistēmu darbību (Vokansona mehāniskā pīle, šahists Turks u. c.), konstruēšana. Vilhelms Šikards (Wilhelm Schickard) 1623. gadā radījis pirmo mehānisko skaitļošanas mašīnu. Blēzs Paskāls (Blaise Pascal) 1642. gadā radījis pirmo ciparu skaitļošanas mašīnu “Paskalīna”, ko vēlāk uzlabojis Gotfrīds Leibnics (Gottfried Leibniz), kurš izgudrojis arī bināro sistēmu un paredzējis universālas spriešanas iespējamību. Čārlzs Bebidžs (Charles Babbage) 1837. gadā pabeidza projektēt “analītisko dzinēju” – mehānisku, programmējamu datoru. 19.–20. gs. iegūtie rezultāti matemātikā (Būla algebra, predikātu loģika, minimaksa teorēma, Tjūringa mašīna u. c.) bija ļoti nozīmīgi atklājumi MI attīstībai. Konrāds Cūze (Konrad Zuse) 1941. gadā uzbūvējis pirmo ar programmu vadāmo datoru. Termins “robots” pirmo reizi parādās Karela Čapeka (Karel Čapek) 1920. gadā sarakstītajā lugā “R.U.R.”

Konrāds Cūze. 1982. gads.
Fotogrāfs Karl Staedele. Avots: picture alliance via Getty Images, 1060974840.
MI pētījumi iedalāmi 9 posmos, no kuriem pēdējie 5 turpinās mūsdienās: MI pirmsākumi (1943–1955), agrīnais posms (1952–1969), reālā stāvokļa apzināšanās (1966–1973), uz zināšanām pamatotas sistēmas (1969–1979), MI kļūšana par rūpniecības nozari (1980–mūsdienas), atgriešanās pie neironu tīkliem (1986–mūsdienas), MI pārņem zinātnisko metodi (1987–mūsdienas), intelektuālo aģentu rašanās (1995–mūsdienas), ļoti lielu datu kopu izmantošana (2001–mūsdienas).
Pirmais pašlaik plaši pazīstamais MI darbs ir Vorena Makaloha (Warren McCulloch) un Voltera Pitsa (Walter Pitts) 1943. gadā izstrādātais mākslīgā neirona modelis. Donalds Hebs (Donald Hebb) 1949. gadā demonstrēja vienkāršu likumu, kā koriģēt saišu spēku starp neironiem. Hārvarda Universitātes (Harvard University) studenti Mārvins Minskis (Marvin Minsky) un Dīns Edmonds (Dean Edmonds) 1951. gadā uzbūvēja neironu tīkla skaitļošanas mašīnu SNARC (Stochastic Neural Analog Reinforcement Calculator). Vislielāko ietekmi uz turpmākajiem darbiem MI jomā atstāja Alans Tjūrings (Alan Turing), kurš 1947. gadā lasīja lekcijas Londonas Matemātikas biedrībā (London Mathematical Society). Lekciju saturs formulēts rakstā Computing Machinery and Intelligence (1950), kurā viņš ieviesa Tjūringa testu, mašīnas mācīšanos, ģenētiskos algoritmus un stimulētu (reinforcement) apmācību. Klods Šenons (Claude Shannon) 1950. gadā publicēja rakstu Programming a Computer for Playing Chess, kurā veica šaha spēles kā stāvokļu telpas pārmeklēšanas problēmas analīzi. Dž. Makārtijs pārliecināja M. Minski, K. Šenonu un Natanielu Ročestru (Nathaniel Rochester) sapulcināt 10 zinātniekus 1956. gada vasarā Dartmutas koledžā (Dartmouth College), lai apspriestu jautājumu, vai intelekta īpašības principā ir iespējams tik precīzi aprakstīt, lai tās varētu imitēt datorsistēmā. Secinājums bija, ka šis darbības lauks ir jāatdala no citām datorzinātnes jomām, tādām kā automātiskās vadības teorija, operāciju pētīšana vai lēmumu teorija. Pēc Dž. Makārtija ierosinājuma, šai jaunajai datorzinātnes apakšnozarei deva vārdu – mākslīgais intelekts.
MI agrīno posmu raksturo ar ierobežotām metodēm gūtie panākumi. Arturs Semjuels (Arthur Samuel) 1952.–1956. gadā izstrādāja vairākas dambretes spēles programmas. Nozīmīgas ir Alena Ņuela (Allen Newell) un Herberta Saimona (Herbert Simon) radītās programmas “Loģikas teorētiķis” (Logic Theorist, 1956) un “Vispārīgais risinātājs” (General Problem Solver, 1957), kas autoriem ļāva formulēt fizisko simbolu sistēmas hipotēzi, kas nosaka nepieciešamus un pietiekamus nosacījumus, lai fiziska sistēma spētu izrādīt vispārīgu intelektuālu rīcību (darbību). Dž. Makārtijs 1958. gadā definēja augsta līmeņa programmēšanas valodu Lisp (nosaukums radies no LISt Processor), kas kļuva par dominējošo MI programmēšanas valodu turpmākajos 30 gados. Herberts Gelernters (Herbert Gelernter) 1959. gadā konstruēja ģeometrijas teorēmu pierādītāju (Geometry Theorem Prover). Rejs Solomonofs (Ray Solomonoff) 1960. gadā ieviesa Beijesa (Bayes) metodes induktīviem spriedumiem. Margarēta Mastermane (Margaret Masterman) 1961. gadā iesāka semantisko tīklu lietošanu mašīntulkošanā. Bertrams Rafaels (Bertram Raphael) 1964. gadā izstrādāja programmu SIR (Semantic Information Retrieval). M. Minska vadītie studenti radīja programmas, kas risina uzdevumus ierobežotās “mikropasaulēs”. Džeimsa Slegla (James Slagle) programma SAINT (Symbolic Automatic INTegrator, 1963) risināja integrēšanas problēmas, Daniela Bobrova (Daniel Bobrow) programma STUDENT (1967) – algebras uzdevumus, bet Tomasa Evansa (Thomas Evans) programma ANALOGY (1968) atrisināja ģeometriskas analoģijas problēmas, kas parādās IQ testos. No “mikropasaulēm” plašāk pazīstama kļuva “bloku pasaule”, kurā robotam-manipulatoram bija jāpārvieto cietas vielas bloki. “Bloku pasaulei” Patriks Vinstons (Patrick Winston) 1970. gadā izvirzīja apmācības teoriju un Deivids Hafmens (David Huffman) 1971. gadā izstrādāja redzes spēju projektu. Terijs Vinograds (Terry Winograd) no 1968. līdz 1972. gadam izstrādāja dabīgā angļu valodā dotu komandu saprašanas programmu SHRDLU (nosaukums radies no linotipa taustiņu izvietojuma). Skots Folmens (Scott Fahlman) 1974. gadā izveidoja “bloku pasaules” plānotāju. Turpinājās darbs pie neironu tīklu attīstības. Heba apmācības metodes Bernards Vidrovs (Bernard Widrow) un Frenks Rozenblats (Frank Rosenblatt) 1962. gadā paplašināja ar saviem perceptroniem (perceptrons).
Pirmajos divos MI attīstības posmos problēmu risināšanai lietoja t. s. vājās metodes, kad programmas atrada atrisinājumus, veicot vienkāršus sintaktiskus pārveidojumus un izmēģinot risināšanas soļu dažādas kombinācijas. Trešajā posmā sāka apzināties reālo situāciju un tika konstatētas trīs veidu grūtības. Pirmkārt, agrīnās programmas neko nezināja par problēmsfēru. Otrkārt, tā kā nebija radīta skaitļošanas sarežģītības teorija, valdīja uzskats, ka atrisināmas problēmas mērogs ir atkarīgs tikai no datora ātrdarbības un atmiņas apjoma. Treškārt, intelektuālas uzvedības ģenerēšanai lietotās pamatstruktūras bija pārāk ierobežotas un spēja atspoguļot pārāk maz. Piemēram, perceptronu ar divām ieejām neizdevās apmācīt, lai tas spētu atpazīt, kad tā ieejas ir dažādas. Centieni savirknēt elementārus secināšanas soļus, lai pārmeklēšanas rezultātā atrastu pilnīgus atrisinājumus, nedeva rezultātus sarežģītu problēmu risināšanā. Radās alternatīva pieeja – lietot problēmsfēras specifiskas zināšanas, kas ļauj vienkāršāk secināt par tipiskiem gadījumiem šauri fokusētās jomās, kur ir vajadzīga augsta līmeņa ekspertīze.
Uz zināšanām pamatotas sistēmas (knowledge-based systems) kļuva par galveno pētījumu un izstrādes objektu MI attīstības ceturtajā posmā. Plaši pazīstamas ir šī perioda programmas DENDRAL (1969) un MYCIN (1974). Pirmo no tām Stenforda Universitātē (Stanford University) izstrādāja Edvards Feigenbaums (Edward Feigenbaum), Brūss Bjūkenens (Bruce Buchanan) – filozofs, kas pievērsās datorzinātnei, un Džošua Lederbergs (Joshua Lederberg) – Nobela prēmijas laureāts ģenētikā. Viņi atrisināja problēmu, kā no masas spektrometra iegūtās informācijas izsecināt molekulāro struktūru. DENDRAL nozīme bija tā, ka programma bija pirmā sekmīgā uz zināšanām pamatotā sistēma. Tās ekspertīze tika iegūta no liela skaita speciālu likumu. Nākamais mēģinājums lietot ekspertu sistēmu jauno metodoloģiju tika realizēts medicīnas diagnostikā. E. Feigenbaums, B. Bjūkenens un Edvards Šortlifs (Edward Shortliffe) izstrādāja MYCIN asins infekciju diagnostikai. Problēmsfēras zināšanu atspoguļošanas un secināšanas ar tām svarīgumu pierādīja arī Rodžera Šenka (Roger Schank) darbi dabīgās valodas izpratnē. Plaši izplatītā MI metožu lietošana reālās pasaules problēmu risināšanai izraisīja pieprasījumu pēc praktiski realizējamām zināšanu atspoguļošanas shēmām (knowledge representation schemas) un programmēšanas valodām. Tika radītas loģikā pamatotas programmēšanas valodas PROLOG (1972) un PLANNER (1969), kā arī valoda Smalltalk (1980), kas deva ierosmi objektorientētās programmēšanas koncepcijai. Paliekoša nozīme MI ir vēl vairākām programmām. Lietojot Rosa Kviliana (Ross Quillian) attīstīto zināšanu atspoguļošanas shēmu – semantisko tīklu, Džeimijs Karbonels (Jaime Carbonell) 1970. gadā izveidoja datorizētu apmācības sistēmu SCHOLAR. Viljams Vuds (William Woods) 1973. gadā radīja dabīgās valodas izpratnes programmu LUNAR. Ērls Sakerdoti (Earl Sacerdoti) 1974. gadā izstrādāja hierarhiskās plānošanas tehniku un programmu ABSTRIPS (Abstraction-Based STanford Research Institute Problem Solver).
20. gs. 80. gados pēc ilgiem pētījumiem un eksperimentiem laboratorijās radās iespējas iegūtos rezultātus komercializēt. Pēc agrīno ekspertu sistēmu (R1, DENDRAL, MYCIN, PROSPECTOR) sekmīgiem lietojumiem industrijā, kas aizsāka MI attīstības piekto posmu, parādījās tūkstošiem jaunu ekspertu sistēmu visdažādākajās jomās, pārsvarā medicīnā, inženierzinātnēs un finanšu sektorā. Praktiski tika lietotas un komerciālus panākumus guva arī atpazīšanas sistēmas (klasifikatori) un mašīngrafikas sistēmas, kuru liela daļa faktiski ir ekspertu sistēmas. Tomēr tēlu (paraugu, pattern) atpazīšanas pieeja atšķiras no sistēmām, kas pamatotas uz zināšanām. Objektus vai situācijas, ko sauc par tēliem, apraksta ar pazīmju vērtībām (diskrētām vai nepārtrauktām). Tēli var piederēt tikai vienai vai arī vairākām klasēm (gadījumā, ja daļa pazīmju sakrīt). Klasifikatoram ir jāatrod tēlu (objektu) piederība pareizām klasēm. Tēlu klasifikācijas uzdevumā objektu piederību klasēm nosaka iepriekš definētas kārtulas. Tēlu atpazīšanas uzdevumā kārtulas atrod, lietojot t. s. apmācības kopu, ko veido objekti, kuru piederība noteiktai klasei ir zināma (apmācība ar skolotāju). Šādi sistēma iemācās pareizi klasificēt arī iepriekš neredzētus objektus. Tieši tā ir apmācības no piemēriem jeb induktīvās apmācības būtība – spēja vispārināt. Sistēmu klāsts, kas pamatojas uz tēlu atpazīšanas pieeju, ir ļoti plašs: perceptroni vizuālo tēlu atpazīšanai, neironu tīkli, attēlu analīzes sistēmas, datorredze, mašīngrafika, runas analīze un sintēze, runājošā atpazīšana, pirkstu nospiedumu identifikācija un daudzas citas. Tēlu formēšanas klasterizācijas uzdevumā novērotos objektus sadala klasteros (grupās, apakškopās) pēc to līdzības pazīmēm. Šī uzdevuma atrisināšana ir vajadzīga zināšanu izgūšanā, datu saspiešanā (data compression) un datu īpašību pētījumos. MI metožu, pieeju un tehnoloģiju komercializācijas rezultātā jau 20. gs. 80. gadu beigās bija simtiem kompāniju, kas radīja ekspertu sistēmas, datorredzes sistēmas, robotus, kā arī programmatūru un aparatūru šiem nolūkiem.
20. gs. 80. gadu vidū no jauna tika atklāts atpakaļizplatīšanās (back-propagation) algoritms, kuru pirmie 1969. gadā bija izstrādājuši Arturs Brisons (Arthur Bryson) un Yu-Chi Ho (Yu-Chi "Larry" Ho, Hé Yùqí). Šo algoritmu sekmīgi pielietoja daudzām problēmām datorzinātnē (mašīnas apmācībā) un psiholoģijā. Mūsdienās to uzskata par MI attīstības sestā posma sākumu. Pašlaik norit ļoti aktīvi pētījumi gan par atpakaļizplatīšanās, gan citu algoritmu lietojumiem apmācībai t. s. dziļajos neironu tīklos (neironu tīklos ar ļoti daudziem slēptajiem slāņiem un milzīgu skaitu mākslīgo neironu).
Tātad MI attīstībā līdz 20. gs. 80. gadu beigām iezīmējās divi virzieni: vienu pārstāv simboliskie modeļi (pamatlicēji A. Ņuels un H. Saimons) un loģiskās pieejas (aizsācējs Dž. Makārtijs), bet otru – t. s. savienojumu modeļi (perceptroni, neironu tīkli, asociatīvā atmiņa). 20. gs. beigās MI saturā un metodoloģijā nozīmīgi kļūst teorijas jautājumi, kas pamatoti stingros matemātiskos principos. Runājot metodoloģijas terminos, savā septītajā attīstības posmā MI noteikti pārņem zinātnisko metodi. Tas nozīmē, ka, lai hipotēzi pieņemtu, jāveic precīzi empīriski eksperimenti un rezultāti ir statistiski jāanalizē. Tādējādi ir iespējams eksperimentus atkārtot, lietojot testēšanas datu un koda kopīgus repozitorijus. Šo pamatdomu ilustrē runas atpazīšana, kur 20. gs. 70. gados dominēja pieejas, kas tika demonstrētas tikai dažiem speciāli izvēlētiem piemēriem. Ieviešot pieejas, kas pamatojas uz slēptajiem Markova modeļiem (hidden Markov models), tika iegūts matemātisks ietvars, lai saprastu problēmu un atbalstītu inženieru viedokli, ka tas praksē strādā labi. Tos pašus apsvērumus var attiecināt uz mašīntulkošanu, kurā lieto informācijas teorijas principus. Arī neironu tīklu pētījumi seko šai tendencei. Rezultātā radās jauna tehnoloģija – datizrace (data mining), lai atrastu slēptas sakarības starp datu grupām. Džūdeja Pērla (Judea Pearl) darbs “Varbūtiskā spriešana intelektuālās sistēmās” (Probabilistic Reasoning in Intelligent Systems, 1988) veicināja varbūtību un lēmumu teorijas nostiprināšanos MI. Beijesa tīklu (Bayesian network) formālisms ļāva efektīvi atspoguļot nenoteiktas (apšaubāmas, uncertain) zināšanas un lietot tās precīzā spriešanā. Dž. Pērla (1982), Erika Horvica (Eric Horvitz) un Dāvida Hekermana (David Heckerman) darbi (1986) veicināja t. s. normatīvo ekspertu sistēmu koncepcijas izstrādi. Šāda sistēma darbojas racionāli saskaņā ar lēmumu teoriju, nevis cenšas imitēt cilvēku–ekspertu domāšanas gaitu. WindowsTM operētājsistēma iekļauj vairākas normatīvas diagnostikas ekspertu sistēmas, lai novērstu radušās problēmas.
Astotais MI attīstības posms tiek saistīts ar to, ka tika atrasta moderna pieeja – intelektuālo aģentu paradigma –, kas ir vispārīga pieeja MI un ļauj apvienot “vienotā veselā aģentā” tā daudzveidīgos virzienus. A. Ņuela, Džona Lērda (John Laird) un Pola Rozenblūma (Paul Rosenbloom) darbs pie projekta SOAR (nosaukums radies no State, Operator And Result) no 1987. līdz 1990. gadam ir vislabāk zināmais piemērs par pilnīgu aģenta arhitektūru. Aģentu sistēmas ir kļuvušas tik parastas tīmeklī pamatotās (Web-based) lietotnēs, ka termins “bots” (bot) tiek lietots ikdienas valodā.
Datorzinātnes 60 gadu ilgajā vēsturē pētījumi ir fokusējušies uz algoritmiem. Tomēr nesenie darbi MI uzvedina uz domām, ka daudzām problēmām svarīgāki ir dati, nevis tas, kādu algoritmu lietot. To pierāda aizvien pieaugošais ļoti lielais datu avotu skaits, piemēram, miljoniem vārdu angļu valodas korpusā vai miljardiem attēlu tīmeklī. Pirmie darbi šajā, devītajā, MI attīstības posmā liecina, ka ilgstoši par “šauro vietu” uzskatītā MI problēma, kā izteikt visas zināšanas, kas datorsistēmai ir vajadzīgas, var tikt atrisināta ar apmācības metodēm, nodrošinot mācīšanās algoritmus ar pietiekamu datu apjomu. Ir radies arī jauns termins “dziļā mācīšanās” (deep learning).