Metodi di mappatura e tecnologie di machine learning

Negli ultimi anni, i metodi di apprendimento automatico “machine learning” basati su implementazione di reti neurali ad apprendimento profondo “deep neural network” sono diventate diffuse. L'implementazione di questi metodi ha permesso di raggiungere risultati rivoluzionari in molte sfere della conoscenza umana.

Oggi, i programmi che utilizzano le reti neurali, riescono a stabilire una diagnosi medica meglio di medici, leggere le labbra, identificare il discorso meglio di professionisti, ricercare nuove molecole, permettono addirittura di generare sequenze video in tempo reale.

Tuttavia, tali reti sono attualmente più usate nel riconoscimento delle immagini. Il loro utilizzo consente di costruire modelli in grado di classificare un'immagine come appartenente una delle migliaia di classi esistenti. Oggi si può effettivamente ottenere una maggiore precisione rispetto a quella di un essere umano, senza attrezzature specializzate.

Il successo in tutte queste aree è diventato possibile a seguito di una serie di fattori:

  • Emergenza di nuove architetture di reti neurali e metodi di training di tali reti.

  • Aumento delle prestazioni delle apparecchiature computazionali.

  • Emergenza di un gran numero di set di dati etichettati (set di allenamento).

La formazione preliminare è necessaria per il funzionamento neurale di una rete. All'ingresso, il set di dati è accompagnato dalle informazioni sul suo contenuto, che è il risultato del fatto che la rete neurale è predisposta per conseguire il risultato dell'elaborazione di dati indipendenti tra di loro.

Per esempio:

  • Fotografie e informazioni relative al suo contenuto vengono caricate per addestrare una rete neurale nel riconoscimento di immagini.

  • Quando i dati dei parametri di salute del paziente vengono caricati nella rete neurale, insieme ai dati sulle diagnosi stabilite, la rete neurale viene addestrata per stabilire le diagnosi in modo indipendente.

  • Il famoso programma Alpha Go usava la registrazione delle mosse dei giocatori principali di Go. Questi dati sono stati aggregati come risultato dei giochi, delle partite effettuate. A questo punto le mosse da parte dei giocatori, con azioni vincenti, sono state considerate corrette. Il programma ha dimostrato risultati straordinari nel 2015, il primo anno dopo la sua creazione; nelle sue versioni successive, dopo aver giocato milioni di partite contro sè stessa, ha raggiunto un livello che non ha lasciato una sola possibilitĂ  per l'uomo. Il giocatore misterioso, soprannominato Maestro, apparso su server Go nel 2017, vincendo ogni partita contro ogni campione. Successivamente, è venuto alla luce che il giocatore è la nuova versione del programma Alpha Go. Non ci sono persone in grado di sconfiggerlo. Quello che sembrava irraggiungibile solo ieri, è diventato realtĂ  di oggi.

Per risolvere il problema del posizionamento preciso del dispositivo dell'utente, noi di Spheroid Universe usiamo reti neurali e metodi di apprendimento automatico ossia di “machine learning”.

Dal punto di vista della programmazione, la tecnologia Spheroid Universe è un aggregato di metodi:

  • La classificazione del sito è condotta per ogni Spazio in base ai record video: acqua, terra, edifici, alberi, oggetti animati, trasporti, ecc., con l'assistenza della rete neurale pre-addestrata.

  • In base ad una nuvola di punti classificati come oggetti statici (permanentemente presenti sul posto), viene creato un modello 3D e delle texture.

  • Viene identificato un insieme di funzionalitĂ  (l'aggregato di elementi di immagine unici e la loro posizione in relazione l'uno con l'altro), in base al quale la piattaforma conduce successivamente una ricerca per determinare la posizione e l'orientamento del dispositivo.

  • Il modello 3D risultante è collegato allo spazio circostante e alla mappa, che fornisce coordinate geografiche precise per ciascuno dei punti del modello. Nella modalitĂ  di utilizzo dell'app, carichiamo le funzioni dell'immagine e i modelli di posizione sul dispositivo dell'utente, in base alla posizione approssimativa dell'utente determinata dai dati GPS del dispositivo. Successivamente, con il contributo della rete neurale, si identifica l'insieme di caratteristiche che corrisponde all'immagine dalla fotocamera del dispositivo, e cerca un insieme simile nei dati della piattaforma. Così, possiamo determinare quale parte del modello e da quale parte la fotocamera del dispositivo è orientata. Poi, confrontando l'immagine con il modello 3D, si determina la posizione precisa del dispositivo in relazione al modello. Queste informazioni consentono di assicurare un'interazione senza soluzione di continuitĂ  di oggetti virtuali con la realtĂ  sul display del dispositivo.

Last updated