Transcript
Big Data
I Big Data
Brunello Bonanni Certified Senior Architect Cuneo 13 Giugno 2013
IM Technical Team Leader © 2013 IBM Corporation
Big Data
Evolvere nel modo di trattare le informazioni
Ieri il Valore era Visibile
Oggi il Valore è Invisibile
Produrre i dati oggi è molto più facile che dargli un senso 2
© 2013 IBM Corporation
Big Data
Una costante dinamica presenza Abilità nel gestire ed analizzare la miriade di dati disponibili nella loro forma nativa: Strutturati, Semistrutturati, Destrutturati, in Continuo Movimento
Ci si sta muovendo nella nuova era del “Cognitive Computing” 3
© 2013 IBM Corporation
Big Data
I computer hanno affiancato i Data Center per entrare nel mondo reale – La trasformazione nella Pubblica Amministrazione 50
Numero di dispositivi connessi 50 Miliardi
La PA oggi
40 Back Office
30 15 Miliardi
20
i Cittadini
Per processi, fondamentalmente asincrona, e ognuno con un suo ruolo distinto
7 Miliardi 10 2010
Front Office
2015
2020
La PA domani
Sistema di Persone
I processi perdono l’accentramento nella fase di Back Office per estendersi verso i cittadini 4
© 2013 IBM Corporation
Big Data
Le Quattro Dimensioni da Fronteggiare Accumulo di documenti in una logica parte daiviene registri e si La moleche di dati che muove negli archivi costantemente generata
Dati generati sempre più rapidamente, impongono una accelerazione dei processi di ricezione, gestione e comprensione dei contenuti
deve essere acquisita, analizzata, e gestita per comprenderne il significato ed operare di conseguenza
Necessità di interrogazioni di carattere generale in tempi rapidi
Volume
Varietà La diversità delle tipologie di informazioni da sorgenti interne esterne crea esigenze di integrazione, gestione, governance, ed Presenza di dati adeguamento architetturale. strutturati e non strutturati 5
Velocità
Veridicità
Dato non strutturato con interpretazione diverse in base alle sfumature del linguaggio I livelli di qualità sono differenti da sorgente a sorgente, in alcuni casi anche indefiniti, ambigui o incompleti, che possono procurare un degrado complessivo di tutto il patrimonio informativo trattato
© 2013 IBM Corporation
Big Data
Un esempio di BIG DATA: velocity, variety, volume. I vettori di conoscenza del consumer DATI NON STRUTT. DATI STRUTTURATI
PROFITABILITY
RECENCY, FREQUENCY, MONETARY PROFILO SOCIO-DEMO FIDELITY CARD, PUNTI PREMIO STRUMENTI DI PAGAMENTO
BASKET E MIX DI ACQUISTO
DATI IN STREA MING
DATI STRUTTURATI
SOCIAL WEB DATA (RT e non RT) consumer
GEO-POSITIONING
VIDEO-INTELLIGENCE (riconoscimento volti e Comportamento fisico)
DATI IN STREA MING
FEEDBACK E-SURVEY DATI STRUTTURATI
GARANZIE PRODOTTI
INFORMAZIONI E RECLAMI AL CONTACT CENTER DATI NON STRUTT.
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 6
© 2013 IBM Corporation
Big Data
I risultati della ricerca condotta in collaborazione con SDA Bocconi Target: CIO e IT Executive di medio-grandi imprese italiane 202 imprese partecipanti Manifatturiero: 31%; Distribuzione e Logistica: 18%; Finance: 11%; PAL-Sanità: 18%, Servizi-Utilities: 22% Medie Imprese (< 1000 dip.) 51%; Medio-grandi Imprese (10005000 dip.) 26%, Grandi imprese (> 5000 dip.) 23% Aziende domestiche 49%; Multinazionali italiane 25%; Consociate di multinazionali estere 26%
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 7
© 2013 IBM Corporation
Big Data
FONTI DATI maggiormente associate ai Big Data Social networks e social media (es. Facebook, Twitter, blogs, forum, …)
54%
Documenti cartacei digitalizzati Email Transazioni Immagini Registrazioni video Dati di geo-posizionamento (GPS)
52% 46% 40% 34% 32% 25%
Dati generati da sensori o misuratori digitali (es. RFID, NFC, meters)
25%
Automazione processi produttivi Clickstream – Web Log M2M (Machine to Machine) data - Internet of Things Digitalizzazione dei processi di R&D (es. nella bioinformatica e biogenetica, chimica, climatologia, ecc.) Registrazioni audio Altro (specificare)
24% 18% 17% 15% 12% 3%
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 8
© 2013 IBM Corporation
Big Data
Principali aree di impatto e di beneficio di business dei Big Data 1.
accuratezza delle analisi del comportamento del mercato e nelle maggiori informazioni sui Clienti (più dimensioni di analisi) al fine di servirlo meglio (con piattaforme digitali di Customer Experience multicanale)
2.
costruzione di una nuova piattaforma IT (che superi i limiti del DW, che permetta analisi di milioni di transazioni, che permetta di analizzare grandi quantità di dati strutturati e non, ecc.)
3.
velocità delle insight a supporto delle decisioni strategiche (predizioni, scenari e previsioni di medio-lungo termine)
4.
analizzare e gestire Point-of-interest aziendali (PdV, magazzini, concessionari e dealer, turbine, cantieri, ecc.) e infrastrutture sul territorio (reti elettriche, canalizzazioni, strade, ecc.)
5.
analisi di dati strutturati e non che convergono in documenti aziendali core dematerializzati (fascicoli sanitari, gestione sinistri, …)
6.
ottimizzazione dei processi aziendali (supply chain complesse, campagne promozionali ripetitive, …)
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi
9
© 2013 IBM Corporation
Big Data
Quale Executive è, o potrebbe essere, maggiormente interessato ai Big Data nella sua azienda? CIO
37%
Un team o un comitato interfunzionale di executive
21%
Chief Marketing Officer
20%
CEO
18%
CFO
15%
Nessun executive
13%
Chief Sales Officer
12%
DG
11%
Risk manager
8%
Altro (specificare)
1%
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 10
© 2013 IBM Corporation
Big Data
Quale Executive … il Cio ma non da solo!
CEO
% sempre rispetto al campione complessivo
18% Nessun executive 13%
DG 11%
1%
3%
2%
5%
2% 1%
3%
1%
4%
Un team o un comitato interfunzionale di executive 21%
1%
5% 1%
CIO
1%
37%
2%
2%
5%
2%
5%
1%
Chief Sales Officer
13%
CFO 1% 2%
5%
15% 1% 2%
Chief Marketing Officer 20%
2%
Risk manager 8%
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 11
© 2013 IBM Corporation
Big Data
Cosa pensano i Manager
Sorgente: (IBM Institute for Business Value in collaboration with Said Business School, University of Oxford, “Analytics: The real-world use of big data, 2012)
12
© 2013 IBM Corporation
Big Data
Fase del ciclo di adozione/maturity/esperienza 1.
La maggioranza delle aziende si presenta nella Fase di comprensione dei BD e dei loro possibili benefici (57%).
2.
Un’altra porzione di rilievo (25%) è consapevole del valore dei BD ma ha “priorità” immediate nella gestione della privacy e della sicurezza dei dati.
3.
Il 25% non sente il bisogno dei BD (con un 7% che ha però avviato una fase di comprensione),
4.
il 18% ha definito una strategia di BD o sta svolgendo studi di fattibilità o ha
avviato progetti in ambito (ricerca a livello Global: 28 % in Execution; 48% in Planning) Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 13
© 2013 IBM Corporation
Big Data
Abilitatori organizzativi per i Big Data
1. il funding, il budget delle iniziative (22%) 2. la corretta valutazione dei ritorni dell’investimento (14%) 3. il committment direzionale (13%) 4. le competenze interne (tecnologiche, analitiche, interpretative) (12%)
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 14
© 2013 IBM Corporation
Big Data
Abilitatori tecnologici per i Big Data
ICT Outsourcing
3,84
Streaming processing
4,05
Hadoop/MapReduce
4,13
Cloud computing/ICT as-a-service
4,23
Sistemi di database management relazionali
4,31
Sistemi di database management non relazionali (es. inmemory,…
4,49
Content Analytics
4,56
Strumenti per l’Integrazione di dati (es. ETL, etc.)
4,57
Business Analytics
4,85 1,00
1,50
2,00
2,50
3,00
3,50
4,00
4,50
5,00
Sorgente- Big Data Live: testimonianze ed eccellenze sul tema Big Data con IBM e SDA Bocconi 15
© 2013 IBM Corporation
Big Data
Cosa pensano i Manager di Business
Sorgente: (IBM Institute for Business Value in collaboration with Said Business School, University of Oxford, “Analytics: The real-world use of big data, 2012)
16
© 2013 IBM Corporation
Big Data
Cambiare il paradigma dei modelli di analisi Data Ingest
17 17
Adaptive Analytics Model
Forecast
Nowcast
Opportunity Cost Starts Here
01011001100011101001001001001 0110100101010011100101001111001000100100010010001000100101 11000100101001001011001001010 01100100101001001010100010010 01100100101001001010100010010 11000100101001001011001001010 01100100101001001010100010010 Bootstrap 01100100101001001010100010010 Enrich 01100100101001001010100010010 01100100101001001010100010010 11000100101001001011001001010 01100100101001001010100010010 01100100101001001010100010010 01100100101001001010100010010 01100100101001001010100010010 01100100101001001010100010010 11000100101001001011001001010 01100100101001001010100010010 01100100101001001010100010010 01100100101001001010100010010 11000100101001001011001001010
© 2013 IBM Corporation
Big Data
Analisi dei Dati in Movimento e dei Dati Persistenti
18
© 2013 IBM Corporation
Big Data
I Patterns ad oggi più diffusi
Big Data Exploration Trovare, visualizzare e comprendere i Big Data per migliorare la conoscenza del proprio Business
19
Enhanced 360o View of the Persone
Security/Intelligence Extension
Ottenere una vista unificata delle persone incorporando alle sorgenti interne le informazioni provenienti dalle fonti esterne
Contenimento dei rischi, analisi delle frodi e monitoraggio della sicurezza in tempo reale
Operations Analysis
Data Warehouse Augmentation
Analisi di tutte le segnalazioni prodotte dai propri sistemi per individuare l’insieme delle azioni composite operate in uno specifico contesto
Integrare big data e data warehouse per migliorare l’efficienza operativa © 2013 IBM Corporation
Big Data
Per IBM Big Data vuol dire un insieme di tecnologie Perseguire chiari obiettivi Solutions Analytics & Decision Management IBM Big Data Platform Visualization & Discovery
Application Development
Systems Management
Accelerators Hadoop System
Stream Computing
Data Warehouse
Information Integration & Governance
– Integrare e gestire il volume, la varietà, la velocità e la veridicità dei dati – Applicare modelli di analisi specifici per il trattamento nelle loro forme native – Visualizzare tutti i dati disponibili per un’analisi per contesto – Disporre di un ambiente di sviluppo per costruire nuove applicazioni analitiche – Monitoraggio, ottimizzazione del Workload e gestione dello scheduling – Sicurezza e Governance – Integrazione con gli ambienti di Datawarehouse – Capacità di operare con open source per condividire esperienze, algoritmi e modelli con la comunità mondiale
Big Data Infrastructure 20
© 2013 IBM Corporation
Big Data
Tecnologia integrata out-of the box Soluzione con Workload Ottimizzato specifico per gli Analytics PureData System for Analytics
Solutions Analytics & Decision Management IBM Big Data Platform Visualization & Discovery
Application Development
Systems Management
Accelerators Hadoop System
Stream Computing
Data Warehouse
Information Integration & Governance
Big Data Infrastructure 21
21
© 2013 IBM Corporation
Big Data
Funzionalità ottimizzate pre-costruite già disponibili Statistics Descriptive Statistics+ Distance Measures* Hypothesis Testing* Chi-Square & Contingency Tables* Univariate & Multivariate Distributions+
Transformations Data Profiling / Descriptive Statistics+ General Diagnostics
Time Series Autoregressive+ Forecasting*
Statistics+ Sampling Data prep
Monte Carlo Simulation*
Data Mining
Predictive
Mathematical Basic Math* Permutation and Combination* Greatest Common Divisor and Least Common Multiple* Conversion of Values* Exponential and Logarithm* Gamma and Beta Functions Matrix Algebra+ Area Under Curve* Interpolation Methods*
Geospatial
Association Rules+
Linear Regression+
Geospatial Data Type
Clustering+
Logistic Regression+
Geometric Functions
Feature Extraction+
Classification
Geometric Analysis
Discriminant Analysis*
Bayesian Sampling
* Fuzzy Logix DB Lytix capabilities + Netezza Analytics and Fuzzy Logix DB Lytix capabilities
Model Testing
22
22
© 2013 IBM Corporation
Big Data
Grazie
Brunello Bonanni Certified Senior Architect IM Technical Team Leader
[email protected]
© 2013 IBM Corporation