;
Twitter összefoglaló a barcelonai Teradata Universe konferenciáról
2011. április 14. Adattárházak · Konferencia · Teradata

Válogatás a konferencia eseményeinek élő közvetítéséből.
Előzmények: Beharangozó, 1.rész, 2.rész.

A következő lista a konferencia ideje alatt publikált több száz Twitter üzenetből válogat.



Április 10, vasárnap
Úton Barcelonába a #Teradata konferenciájára. A ferihegyi új SkyCourt elég impresszív első látásra és még konnektorok is vannak :-)
The team will be touching down in Barcelona tomorrow for #tduniv - 258 days of planning and we are finally here!
Megérkezünk Barcelonába. 27 fok, napsütés. Becsekkoláskor mellettem Stephen Brobst, a Teradata CTO-ja.
Kezdődik a #Teradata sajtótájékoztató Barcelonában. Először általános bejelentések, aztán valami nagy újdonság jön, de holnapig titkos lesz
A Teradata tavaly 13%-os növekedést ért el. Idénre a terv 12-14%,amivel jócskán túl fogja lépni a kétmilliárd dolláros árbevételt
Új Teradata ügyfelek: MAERSK (hajózás), UKRSIBANK (ukrán pénzintézet), PKO (lengyel bank). Erős jelenlét a régió pénzügyi szektorában.
Kezdődik az új, holnapig titkos Teradata technológia bemutatása.
Április 11, hétfő
Hamarosan kezdődik a megnyitó előadás a Teradata barcelonai konferenciáján. Mindenhol narancssárga fények, rockzene, sok ember, jó hangulat
Elsőként egy videóbejátszás Barcelonáról, ahol narancssárga pólós futóhölgyek és kerékpárosok száguldoznak
Bevezetőt mond az esemény házigazdája. A konferencia témája idén: Do more with your data.
A színpadon Hermann Wimmer, a Teradata EMEA elnöke
Elismerő szavak a konferencia szervezőinek. Hatalmas munka egy ekkora eseményt tető alá hozni.
Data as raw material - The Economist, 2010
Kritikus sikerfaktorok: 1: Right Time Analytics 2: Democratisation of Data 3: Integrating Big data
Right Time Analytics - a megfelelő adat, a megfelelő elemzés a megfelelő időben. Lehet másodpercek, percek, vagy órák, az üzlettől függ.
Példák az egészségügy és a bankszakma területéről a megfelelő időben történő adatfelhasználásról
2. faktor: Az adatok demokratizálódása Best Buy - 40.000 felhasználó (1/3 az összes dolgozónak), napi 2 millió lekérdezés
Data should be reused Lloyd reklám, rajzfilmfigurákkal.
3. trend: Integrating Big Data Terabyte age: tranzakciók adatai Petabyte age: interakciók adatai Zetabyte age: szenzor adatok
Szenzor adatokra jó példa a "smart metering", az energiafelhasználás intelligens mérése
Kicsit köhög a wifi néha
További szenzor példák: erőforráskezelés, például vízfelhasználás követése, telekom hálózat műszaki adatai
A háromféla adat (tranzakciók, interakciók, szenzorok) az adattárházban találkoznak. Mapreduce az interakciók oldalán
Vége a bevezető előadásnak. Jönnek a termékbejelentések
A színpadon Scott Gnau, Chief Development Officer of Teradata
Az újdonság: a Teradata 6680 hibrid platform, ami SSD és hagyományos merevlemezeket egyaránt tartalmaz
Videóbejelentés: www.youtube.com/watch?feature=youtube_gdata_player&v=fJTtBUY4lqY
Visszatekintés: Teradata adatbázis 13.10, temporal képességek, kompresszió, kiterjeszthetőség
A 6680 hibrid platform automatikusan mozgatja a "forró" és a "hideg" adatokat az SSD-k és a hagyományos lemezek között a használat alapján
Big Data jellemzők: Skálázható analitika, újfajta adattípusok, nem-SQL analitika
Hadoop fejlesztési partnerek: Cloudera, Karmasphere
Az Aster Data akvizíció is a Bigdata elemzéseket célozta
A színpadon Wimmer és Gnau együtt
Az adatok felhasználási mintája: 43% of IO uses 1,5 % data 85% of IO uses 15% data 94%of IO uses 30% of Data
Grafikon: az adattárház "felmelegedésével" a lekérdezések egyre gyorsabbal lesznek, mert a fontos adatok az SSD-re kerülnek át automatikusan
A színpadon Mike Koehler, a Teradata vezetője (president and CEO), aki beszámol a cég helyzetéről.
Az elmúlt években a Teradata árbevétele 1,7 milliár dollár körül ingadozott, de tavaly 13 százalékkal nőtt, közel 2 milliárdra
2007 óta az alkalmazottak számra erősen nőtt, 5000 körülről 8.000-re. A válság alatt is folyamatosan bővült a létszám
Széles körű elismerések: vezető DW szállító, vezető marketing szállító, etikus vállalat, stratégiai IT partner
Az analitika fontos versenyelőny, de komoly kihívásokkal jár: adatmennyiségek nőnek, újfajta adatok és elemzések. Ez igen költséges is lehet
Az igazi kihívás a rendelkezésre álló adattömeg hatékony, üzletileg racionális kiaknázása
Koehler a integrált, analitikára épülő marketing előnyeiről beszél, az Aprimo felvásárlás kapcsán
A Teradata hármas stratégiája: EDW, Marketing, Big Data Analytics
Következő előadó: Clay Shirky, Writer, Consultant and Teacher of New Technology and Social Media
Az előadás témája: Cognitive Surplus
A szociális média lehetőséget ad az elégedetlen ügyfeleknek az összefogásra és szervezkedésre - akkor is, ha a cégek ennek nem örülnek
Predicting the Future with Social Media: Mozifilmek elemzése a Twitteren
A kérdés: mennyire függ össze a filmek kibocsátás előtti twitteres forgalma az első héten elért bevételekkel? A válasz: nagyon.
Shirky arról beszél, hogy rengeteg hasznos információ keletkezik a vállalatokon kívül, amire nagy szükség van a belső döntéshozatalhoz
PatientsLikeMe.com: Közösség szolgáltatás hasonló kezelésben részesülő betegek megtalálására
Vége Shirky előadásának, kávészünet kezdődik és a 6680-as hibrid platform helyszíni bemutatása
Lassan kezdődik a következő előadás. Úgy tűnik, hogy a konferencia egyik zenéja a Take a walk on the wild side. Passzol a Bigdata témához.
Jön: Daniel Rodríguez Sierra, Global IT Business Intelligence Director: Telefónica’s journey to developing a global BI capability
Telefonica brandek: Movistart, O2, Terra, Vivo
25 ország, 260 ezer dolgozó, 60 milliárd dollár árbevétel. Fő területek Európa és Latin-Amerika.
Első DW 1998-ban, 2009-re elérték a petabájtos méretet
A különböző országokban az operátorok különböző BI képességekkel rendelkeznek, ezeket egységesíteni kell
Az üzleti intelligenciát mint folyamatot érdemes kezelni
A Telefoncia számos élenjáró technológiát alkalmaz a CRM területén
A Telefonica régebben az összes célra a Teradata high-end platformjait használta
A Teradatával közösen fejlesztett új, globális rendszer az egyes operátorok rendszereitől függetlenül müködik.
A Quark alapja a Teradata logikai adatmodellje.
A képernyők lovak és csecsemők. A magas fokú specializálódásnál jobb a magas fokú adaptációs képesség.
A különböző operátorok saját tempójukban vezetik be a Quarkot
Brazíliában 60 millió ügyfél, 14 külön adattárházat konszolidáltak
Google Books keresés: Labs Books Ngram Viewer
Az előadás képen: yfrog.com/h2rxtskj
Az előadás végén Einstein, vonatok és nagy taps.
A következő előadó David McCandless, Data Journalist. Az előadás címe: Information is Beautiful
A bevezető szerint infografikák tervezésével foglalkozik
Az első ábrán milliád dollárok szerepelnek. Most jön: Debtris. Nagyon remélem, erről lesz publikus video, a szavak itt kevesek
Persze hogy van: informationisbeautiful.net/2010/debtris/
Ujabb abra a felelmek felbukkanasarol. Capak, aszteroidak, Y2K
A leggyakorobb szakitasi napok a Facebook statuszok szerint. Karacsony elott, tavasszal, aprilis elsejen
Az adat az uj olaj. Meg az uj talaj. (oil/soil)
datasets changes the mindset
A legtobb katona Kínában van, de a népesség arányához képest csak a 164. helyen vannak
Visual work experience szines oszlopokon, egy infografikushoz illoen
Abra: ki perel be kit a telekom iparagban. A csokkeno es novekvo bevetelek erosen befolyasoljak a pereskedesi hajlamot
Tobbet nezunk tevet, mint amennyit a wikipedia szerkesztesere szanunk. Sokkal.
Az izlandi vulkankitores effektive csokkentette a CO2 kibocsatast a sok torolt repulojarat miatt
Snake oil adatok online elerheto
A Walmart osszes boltjanak terulete nagyobb, mint Manhattn. Masodik a McDonalds
Az online keresesekben ket dolog elozi meg a szexet: facebook es youtube
Play more with your data - lenyűgöző előadás volt. Most ebéd.
Délután szekcióelőadások. Az első blokkban Etisalat Misr, VTB24, Air France-KLN
A második blokkban KPN, Coca-Cola, PayPal
A KPN előadásának címe: BI Bright - Experiencing the Extreme, building the Basics for a Brighter Future!
KPN: 13,4 milliárd euró bevétel, 30,599 alkalmazott, több tizmillió ügyfél. A telekom minden területén jelen vannak.
A 2008-as helyzetet bemutató ábrán számos klasszikus probléma: adatminőség, adatsilók, nem megfelelő BI használat, hiányos ügyféladatok
A BI a felhasználók által is látható része a költségek 30-40%-a, a többi az adatinfrastuktúrára megy el, amit csak kevesen ismernek
IT átalakulás: A spagettitől (alaprendszerek káosza) a lasangáig (üzleti célok szerint rendezett információk)
Olyan szállítót kerestek, aki másutt már kipróbált adatmodelleket, mérőszámokat, riportokat tud szállítani
A dobozolt megoldás olcsóbb, gyorsabban bevehető és kevésbé kockázatos
9-11 Create Sence of Urgency. Megpróbálták a vezetőség figyelmét felhívni arra, hogy valamit tenni kell, méghozzá sürgősen.
Egy Teradata Proof of Concept projektek csináltak, és fizettek érte, ha nem is szívesen
Mindenképpen meg akarták győzni a vezetőséget, hogy a jelenlegi helyzet nem fenntartható, a semmittevés nem megengedhető
Megnézték, hogy mi történne, ha szeptember 11-én lekapcsolnák a jelenlegi BI rendszereket. Milyen információkra lesz szükség? Hogyan?
Igen jelentős karbantartási megtakarításokat vártak, 50%-os OPEX csökkenést például
A KPN sok Oracle megoldást használ, például CRM-re. Adattárháznak mégis Teradatát választottak, többféle okból
Az ügyfélek életciklusával foglalkozó POC nagyon jól sikerült, 100%-ra. Határidőre és a költségvetés betartásával elkészült minden.
Jelenleg a BI Basix program folyik, az alapok lefektetése a cél az újgenerációs DW-ben. Egy Teradata 5555-ös rendszert vettek.
Nagyméretű, komplex szervezett áll a program mögött. Legalább 3-4 igaz hívő ("BI Believer") kell, különben bajok lesznek
Az ETL Informatica használatával történik,a frontend Oracle BI és Cognos
A BI Roadmap 2013-ig van kidolgozva. Tervezik egy BICC felállítását is.
Néhány hét alatt készült egy demo a Teradata sandbox és az Oracle BI használatával a várható eredmények érzékeltetésére
Másik demo a Save team-ok számára, akik a lemorzsolódni készülő ügyfelek megmentésén dolgoznak. Kevesebb mint 30K volt a költség
Tanulságok: Csúcsvezetői támogatás (steering group CFO/CIO szinten). Demonstrálni kell az eredményeket folyamatosan. Kell a 3-4 igaz hivő.
Agilis fejlesztés (RUP), 4-5 hetes fejlesztés a sandboxban, 2 hónapos ciklus
Vége az előadásnak, kérdések jönnek.
Rövid interjú Scott Gnauval, a fejlesztések irányítójával. Hibrid tárolóplatformok, Aster Data/Kickfire felvásárlás, fejlesztési tervek
Most média kerekasztal következik, amit az ígéretek szerint élőben lehet követni a www.teradataemea.com weboldalon
A résztvevők listája: a Telefonica és az eBay képviselője, Stephen Brobst CTO és David McCandless, az infografikák mestere
Az első kérdés az Ebayos Ratzesberhez: Milyen új dolgokat csinálnak? A válasz: a tranzakciók mellett egyre fontosabbak a viselkedési adatok
Helyesen: Oliver Ratzesberger
A videó stream kb. 5 másodpercet késik, de nézhető: bit.ly/fRn5CI
Az eBay nagyon komolyan invesztál az open source szoftverekbe is. Hadoop alapú platformot is használnak.
Például Hadoopot használnak képhasonlósági feldolgozásnál, a "mutass nekem ehhez hasonló árukat" típusú kereséseknél
Teradata is használ open source komponenseket a GIS funkcionalitásban
A Cloudera a Hadoop Novellje. Nohát.
Brobst: A klasszikus BI eszközök üzleti kérdések megválaszolására valók. Az adatvizualizáció célja az érdekes kérdések megtalálása.
Az Ebay is hosszabb ideje próbálkozik különböző vizualizációs technikákkal. Erre a felhasználókat is tanítani kell, csak a táblákat kedvelik
Az információbiztonság is fontos része a BI kezdeményezéseknek, de nem mindig figyelnek rá
A egyik visszatérő kérdés: Az újonnan bejelentett, önhangokó 6680-as hibrid platform mennyire képes kiváltani a DBA-k tuning munkáját?
Az eBay óriási adatmennyisége lekérdezési volumenek vannak. Az optimalizálás ezért nem egyedi szinten, hanem a nagyobb minták alapján megy
Brobst: Az szakértők szeretik azt hinni, hogy okosabbak a szoftvernél a tuningban, de ez nagyon ritkán igaz. A kontroll feladása a probléma
Kérdés: az Ebaynél mik a felsővezetői szinten érzékelhető eredményei a sok adattárházas befektetésnek?
A viselkedési adatokból kinyerhető haszon területén még csak a felszínt karcolgatják
A végéhez közlekedik a kerekasztal. Éppen a SAS-Teradata kapcsolatnál és az in-database adatbányászat kérdéseknél tartunk.
Az R nyelv is említésre kerül, az eBaynél többen is használják, különböző algoritmusokat fejlesztenek és futtatnak
A Teradata is rendelkezik beepitett tamogatassal
Vége a kerekasztalnak. Este gálavacsora itt yfrog.com/gyjftmuj
Április 12, kedd
Hamarosan kezdődik a barcelonai Teradata konferencia második napja. A nyitó plenáris előadást ma Sir Terry Leahy, a Tesco vezére tartja.
A házigazda hölgy Anne de Baetzelier. Foglalkozása: multilangual presenter www.annedb.be/
Sir Terry Leahy a színpadon. Az előadásának címe: Management Lessons and the Future of Retailing
A 90-es években a Sainsbury volt a minőségi áruházlánc, az olcsó szegmensben is sokan versenyeztek, a Tesco valahol középen megragadt
A Tesco az elmúlt 20 év alatt gigantikus mértékben fejlődött, és többszörösen lekörözte a Sainsburyt és a Marks & Spencert
A siker (egyik) oka: az információk jobb kiaknázása és hasznosítása.
Tanulságok: 1. Ismerd a valóságot (Find the truth). 2. Vakmerő célok (Audacious Goals)
A szervezetek sokkal többre képesek, mind gondolnák, ezért kellenek vakmerő, bátor célok
3. lecke: Vizió, értékek és kultúra.
Tesco értékek: No one try to harder for customers. Treat people how we like to be treated
4. Lecke: Kövesd az ügyfelet (Follow the Customer).
5. Lecke: A kormánykerek (The Steering Wheel)
6. Lecke: Emberek, folyamatok és rendszerek (People, Process, Systems)
A Tesco Fresh & Easy boltok jó példák a folyamatok és emberek összehangolt fejlesztésére
7. Lecke: Az adatok értéke felbecsülhetetlen (Data is Priceless)
A Tesco Clubcard 1995-ben jelent meg, talán az első széles körben használt loyalty kártyaként
1 százalék visszatérítést adott (1 penny from every pound), és nagy siker lett.
A promóciók sikeressége 3-10-szer jobb a kártyatulajdonosok célzott körében, mint általában
8. lecke: A konkurencia hasznos (Competition is Good)
A konkurencia a legjobb üzleti tanácsadó. És ingyenes.
9. lecke: Leadership
Sir Terry most a kereskedelem jövőjéről beszél, mik lesznek a növekedés hajtóerői
Bizalom az ügyfél és a kereskedő között, a megfelelő információk használata
Az egészség egy olyan terület, amire az emberek mindig sokat költenek. Ki ne szeretne örökké élni.
Kényelem. Például okostelefonon (iPhone) futó Tesco alkalmazás segíti a vásárlást.
Egyszerűség. Automata kasszák, bankautomaták mint kényelmesen használható, hasznos technológiák
Loyalty. A legjobb kedvezményeket sokszor nem a lojális, hanem az ide-oda csapongó, szédelgő ügyfelek kapják. Ez változni fog.
Fenntarthatóság. A zöld gondolkodás terjed. A Tesconak van egy nulla CO2 kibocsátású mintaüzlete. 2020-ra minden bolt ilyen lesz.
Vége az előadásnak, most kérdések jönnek a közönségtől.
A zöld shop technológiákon (világítás, hűtés, stb) túl mit tesznek még a fenntarthatóság érdekében?
Válasz: A logisztikában is sok a fejlesztés, jobb teherautók, a vasút nagyobb arányú használata, hajózás. Együttműködés a termelőkkel.
Kérdés: Hogyan fogja az online kereskedelem megváltoztatni a Tesco hagyományos üzletvitelét?
Válasz: A Tesco gondolkodásának központjában az ügyfél van, a csatorna (online/offline) másodlagos.
Az online forgalom 3-4x jobban nő, de a vásárlók igénylik a hagyományos vásárlási élményt is
Kérdés: Mik voltak a kihívások az adatok felhasználásában?
Válasz: Egyrészt a sebesség, mert adatok az idő múlásával gyorsan veszítenek az értékükből, másrészt az infók megfelelő helyre eljuttatása
Kérdés: Az árazás mennyire fontos, milyen lehetőségeket lát ebben a Tesco?
Válasz: Az árakat sokszor a verseny diktálja, de persze jobb információk birtokában árazni is jobban lehet
A versenyről: Ha egy cég csak második, akkor muszáj lépnie. A semmittevés kockázata nagyobb lesz, mint a cselekvéssel járó kockázatok
Kérdés: Mi volt a Tesco legnagyobb kihagyott lehetősége, mondhatni kudarca?
Válasz: Számtalan döntést kell meghozni, így a hibák is szükségszerűek. Fontos, hogy ezt ne büntessék, mert akkor senki nem mer kockáztatni
Vége a Tesco előadásnak, tapsvihar, kávészünet. A szünet után párhuzamos szekciók, benne Electronic Arts és fociVB, aztán eBay előadás
Kezdődnek a szekcióelőadások. A HSBC prezentációja annyira izgalmas, hogy a médiát nem engedik be.
A Customer Insight szekcióban Electronic Arts. A bevezető FIFA 2011 videóban a Real Madrid két góllal nyer.
A játékiparban a bevételek nagy része az online és a mobil/handheld szegmensekből várható
Az EA 2010-ben 5 olyan játékot dobott a piacra, ami 5 milliónál több példányban kelt el. Közte: FIFA, Madden NFL, Battlefield,
EA Kulcstényezők: Egyetlen adattárház, közös mérőszámok, kampánymenedzsment
A DW architektúra a szokásos, staging terület, aztán egy egységes, normalizált réteg, majd az adatok fogyasztására adatpiacok
A Sandbox filozófia itt is megvan a felhasználók saját adatainak becsatornázására. Lekérdezésre MicroStrategyt használnak.
Üzleti elemzések: Ellensúlyozza-e az XBOX növekvő FIFA 11 vásárlásai a Playstation 3 csökkenő eladásait?
Éves szinten A FIFA 2010 eladásai még mindig több mint egynegyede az összesnek a digitálás csatornában
Tranzakciók elemzése. Az online folytatott NHL játékok összes akcióját (lövések, passzok, minden) adattárházba gyűjtik és vizualizálják
Kampánymenedzsment. A cél a bevételek maximalizálása, a felhasználói elégedettség növelése, reális költségek mellett
Az EA napi 150 mikrokampányt folytat le. Erősen szegmentált, magasan targetált kampányok ezek.
Példák: Demót kipróbáló játékosok számára automatikus követő emailek. A játékban elért haladáshoz kapcsolt infók/tippek.
Bőséges keresztértékesítési lehetőségek: Letölthető fizetős tartalmak (DLC), hasonló típusú játékok ajánlása
Az EA is a Hadoop felé mozdul a játékok közben rögzített adatok feldolgozására
EA előadás kérdésekkel zárul. Következő előadó az eBay-tól Oliver Ratzesberger, aki a Világ Legnagyobb Teradata Adattárházát menedzseli
Az Ebay előadásban várhatóan röpködni fognak a terabájtok és petabájtok
Az elmúlt években az eBay nagy átalakulásokon ment át. Nagyobb választék, forgaási sebesség növelése, testreszabás
Például a listázási díjakat a töredékére csökkentették. Az ilyen döntések alapjául elemzések szolgálnak
A bizalom növelését szolgálja a Top Rated Seller kitüntésés. A forgalom kb. egyharmada innen jön már. Évi két probléma, és oda a badge
Az egyes jellemző keresésekhez - például divat - specializált ajánlatokat adnak, akár külön tematikus aloldalakon
Az eBay adja a legjobb gyémántvásárlási élményt az interneten az erre specializált shopjában
Vajon az eBay forgalmának mekkora része jött tavaly mobil készülékeken át? A válasz 2 milliárd dollár, ami elég brutális
Ebből kifolyólag nagyon erős a fókusz a mobil készüléken, többféle alkalmazás is van okostelefonra, például eBay Fashion for iPhone
Jönnek az órási számok: napi 50 terabájt adat keletkezik
Ez a dia az adatmennyiségekről megvan már korábbról, érdekes lesz majd összevetni, milyen a változás
Az eBay analitikus lekérdezéseinek 85/-a új és ismeretlen. Az előre ismert mérőszámokat olcsó előállítani, de az újaknak van igazi haszna
Egyre szélesebb körben használnak analitikát, adatfelderítés, próbálkozások,új ötletek. Számos adatpiac.
A külön adatpiacok TCO-ja nagyon magas $500k-1M+, ezek rejtett költségek. Ha az eszközök ingyenesen jönnek, az sem elég olcsó emiatt.
Az eBay megoldása: virtuális adatpiacok. Egy közös infrastruktúrán egymás mellett üzemelnek az adatpiacok, közös erőforrásokon.
A Teradata workload management képességei gondoskodnak az erőforrások megfelelő kiaknázásáról
A felhasználók önállóan hozhatnak létre új virtuális adatpiacokat, amik alapértelmezés szerint 90 napig élnek
Az EDW mellett új platform a Singularity: 40+ petabájt, 100+ konkurrens felhasználó.
Jellemző Singularity kérdés: Felhasználói aktivitás tavalyhoz képest. A kiaknázás MicroStrategy, Tableau, SQL
Hadoop is van, 20+ PB, például természetes nyelvi feldolgozásra, hasonló képek keresésére
A 3 platform (EDW, Singurality, Hadoop) más-más előnyökkel és felhasználási karakterisztikákkal rendelkezik
Az EDW-ben strukturált adatok vannak, a Hadoopban nem strukturált (pl. weblog), a Singularity a kettő között
Logadatok félig feldolgozva kerülnek a Singularity adatbázisba, fontos mezők ki vannak emelve, a többi marad egyben. Tömörítés: 84%
18 hónap, 2 PB, 2 trillió rekord. Egyetlen táblában.
a félig strukturált adatokat SQL-el kérdezik le, a "nyers" mezőket függvények segítségével kezelik, és futásidőben nyerik ki az infót
Általában is hasznos módszer. Az adatmodellezés csak minimális mértékű, a struktúrát csak a lekérdezéskor teszik mellé.
eBay DataHub. Zárt, belső szociális háló a dolgozók számára, kollaborációra. Beépített intelligens kereső a tudás megosztására
Mindenki létrehozgat új oldalakat/munkaterületeket, hogy a saját területén előkerülő problémákat és tapasztalatokat közzétehesse
Élő elemzések és adatvizualizációk is közzétehetőek a használt BI eszközök (MicroStrategy, Tableau) integrálásával
Az email az információ halála, mondja Oliver. Ezért kell a DataHub..
Jelenleg folyik a belső dashboardok mobil BI eszközökre történő kiterjesztése
Jönnek a felhasználói kérdések
A sikerhez nem elég a jó adat, a felhasználói közösséget is menedzselni kell
Vége az eBay előadásnak. Most ebédszünet. Délután újra érdekes előadás a Formula-1 és az adattárházak kapcsolatáról
A barcelonai Teradata konferencia következő előadása: Data in the Fast Lane. Előadó Mark Gallagher, a Cosworth Forma-1 részlegének vezetője
A Cosworth a mérnökcégek között kicsinek számít, kevesebb mint 500 dolgozóval
1967 óta vannak jelen a motorokkal a Forma 1-ben, csak a Ferrari nyert náluk több bajnoki címet
Egy F1 motor mindössze 95 kiló
A motorok és autók tervezése régóta számítógéppel történik
Az F1 kocsikban összesen több mint 400 külön rendszer van, amit egyedileg monitoroznak. Csak a motorban több száz.
Amikor a motorokat átadjuk az ügyfeleknek, akkor kapnak hozzá egy csomó referenciaadatot is a gyári mérésekből
A futamok alatt számos mérnök valós időben monitorozza a telemetrián beérkező adatokat
Ha a vezetőnek például nagyobb teljesítmény kell, akkor ezt a mérnökök tudják a helyszínen optimizálni
Persze így a fogyasztás is nőni fog, ezt is figyelembe kell venni
A sofőrök összes mozdulatát követik - kornánymozdulatok, pedálszögek, sebességváltások
A régi időkben vereség esetén mindig a kocsik volták a hibásak, nem a sofőrök :-)
A F1 egy technológia háború a csapatok között
A kivetítőn Hamilton. 12 éves kora óta tanulja a rendszereket.
A McLaren kocsik volánja elborzasztó mennyiségű gombot tartalmaz.
A szabályok szerint akármennyi adatot lehet mérni és kiküldeni a kocsiról, de visszafelé nem mehet semmi, hogy ne lehessen távirányítani
A kormányon van egy Drinks feliratú gomb is :-)
Itt egy link a kormányról: mclaren.com/page/our-2011-spec-steering-wheel-2
Az előadó határozott véleménye, hogy a verseny megnyerésében nem a sofőr vezetési képességei az igazán fontosak, hanem a technológia
A F1 médiajogaiból 1 milliárd euró körüli összeg folyik be. Igazságosan megosztoznak rajta, fele a csapatoké, fele Bernie zsebébe megy
A régebbi időkben rettenően veszélyes volt az F1-ben versenyezni. Több tucatnyian haltak meg a pályán. Az utolsó Senna volt.
Historikus videóbejátszás Senna balesetéről, a telemetriás adatokkal kiegészítve
Azóta nagyon sokat tettek azért, hogy ne legyen több halálos baleset. Külön mérőműszerek, baleseti szimulációk, töréstesztek
4 éve volt egy baleset, 290 km/óra sebességnél. A kocsi apró darabokra tört, a sofőr komolyan baj nélkül megúszta, tovább versenyzett
Arra is figyelnek, hogy baleset esetén a kerekek ne tudjanak szabadon szétrepülni és így további sérüléseket okozni. Extra biztosítók.
A Ferrari és Schumacher sikersorozatának kulcsa is egy nagyszabású fejlesztési és adatgyűjtési program volt
Befejezésül mókás történetek a Forma-1-es világból, ahol a pezsgőt nem csak locsolják, de meg is isszák.
A közönség legalább fele F1 rajongó, ez látszik a taps mennyiségén is.
Az utolsó plenáris előadó Alain de Botton volt, a munkáról és a boldogságról.
A konferencia hivatalos zárása is megtörtént, de holnap délelőtt még lesznek hosszabb, úgynevezett Super Session előadások.
Április 13, szerda
A barcelonai Teradata konferencia utolsó délelőttjén szupersession Stephen Brobsttal a szociális hálók elemzéséről
Gráfelmélettel és releváns könyvekkel kezdünk, Barabási is szerepel a listán
A legáltalánosabb felhasználási területe a szociális hálózatoknak az üzletben a marketing
Körelemzés: A háló egy csomópontjának vesszük a szomszédait, és ezekre különféle mérőszámokat állapítunk meg
Hányan használnak egy bizonyos terméket, vagy hányan lettek ügyfelek a központi csomópont előtt/után
Az SNA (Social Network Analysis) segítségével a hagyományos marketing számos problémákán lehet segíteni, példa tiszta kontrollcsoportok
Mérőszámok a szociális hálóban: Központiság, kapcsolatok száma, befolyás mértéke, kapcsolatok mérőszámainak átlaga
Az elemzés 6 alapvető lépésből áll
1. Adatok előkészítése. 2. Mérőszámok számítása. 3 SNA model építése. 4. SNA model scoring 5. Cél- és kontroll csoport képzése. 6. Mérések
Kapcsolatok előállítása: Különböző tevékenységekhez (például hanghívás, SMS) külön-külön típusú élek tartoznak
A szociális hálókat adatait hagyományos relációs adatmodellekben lehet tárolni
A mérőszámokat közvetlenül a Teradata adatbázisban lehet számítani. Az egyszerűbbeket sima SQL-lel, a bonyolultabbakat egyedi függvényekkel
Mérőszám példák: Mekkora a közvetlen (Degree 1 - D1) ismerősök száma? Mekkora a D2, ha az ismétlődéseket nem számítjuk
Szép ábrán a központiság definicója Philip Bonacich szerint. Hasonló a Google Pagerankhoz.
További mérőszámok: Viszonosság, háromszögkapcsolatok, Köztesség
Sürűség: A szociális hálóban ténylegesen létező élek száma osztva az összes lehetséges éllel
Ez csak néhány példa volt, a potenciálisan számolható mérőszámok listája hosszú
inverse cascading modell: annak esélye, hogy egy hatás vagy üzenet átmegy egy élen
Affinity modellek és Viral modellek összehasonlítása nagy táblázatban
Mellettem egy úriember előhúzott egy A4-es papírt két oszlopdiagrammal rajta, és komor arccal bámulja
SNA mini esettanulmámy: Dolgozók megtartása a Google-nél
2010 Best HR Ideas díjat nyertek azzal, hogy szociális hálók segítségével azonosították azokat a dolgókat, akiket meg kell tartani
Adatok: Telefonhívások, SMS, levelezés, meeting adatok, szervezeti stuktúra.
Egyes befolyásos dolgozók távozása esetén további értékes munkatársak is veszélyben vannak. Az SNA megmutatja, hogy kik a veszélyeztettek
Az SNA mérőszámokat jól lehet kombinálni más adatokkal ehhez: fizetés, évek száma a cégnél, teljesítményértékelések, bejárási távolság
Érdekes gondolat, hogy az SNA hasznossága a rendelkezésre álló adatok tömegétől is függ. A régebbi cégeknek több van.
Most telekom példák következnek, sok-sok hívásrekorddal
Elemzési területek: Churn, X-Sell, Up-sell
Akvizíciós modellezés során a szociális mérőszámokat együtt kezelték a hagyományos attribútumokkal, és általában fontos hatásuk volt
Szociális profilozás: Milyen SNA jellemzőkkel bírnak azok az ügyfelek, akik új ügyfelek szerzését befolyásolják
Korai churn előrejelzése szociális hálókra épülő viselkedési minták alapján
2,4 millió ügyfélből 24 ezer veszélyben forgót találtak
Egy megfelelő ajánlattal 10 százalékkal tudták így csökkenteni a lemorzsolódást
Újabb példa az értéknövelt szolgáltatások vírusmarketingjére
1,1 millió ügyfélből 56 ezer volt hajlamos vásárolni, 236 ezer bírt jelentős szociális befolyással, ebből 12 ezer közös. Ők a célcsoport.
Nevesített churn esettanulmány: Optus, Ausztrália
A churn befolyás mértékben nincs szoros kapcsolatban az aktivitással
Újabb példa: Rogers Communications. Az ajánló kampányokban szerepelt az SNA modellezés a legjobban
Most az új médiákon történő SNA elemzésről lesz szó
A világ legnagyobb 20 márkájára irányuló keresések több mint 25%-a felhasználók által előállított tartalmat talál
A 25-34 korosztály a telefonnál jobban szereti az SMSt, a még fiatalabbak pedig a közösségi médiát..
A közösségi oldalak felhasználóinak száma nagyobb, mint az email felhasználóké. Ez kicsit furcsa.
Az Apple részesedése a médiában sokszorosa a valós piaci részesedésüknek
Szóba került a szentimen elemzés is - Mit mondanak rólunk?
Új szakkifejezés: Twinfluencer, azaz Twitter influencer, olyan ember, akire sokan figyelnek
Azok a legnépszerűbbek, akik pozitív és negatív üzeneteket egyaránt küldenek
Előkerült az Apple AntennaGate is
Malcolm Gladwell Tipping Point című könyve a terítéken, a fontos szereplők ( Mavens) megfelelő kezelésével kapcsolatban
Social Netwok Analysis <> New Media Analysis. De a kettő együtt nagyon hatásos
A hívásadatok mintája annyira jellemző, mint egy ujjlenyomat. Vagy legalábbis mint egy elkenődött ujjlenyomat. Nem tökéletes, de sokat mond
További SNA felhasználási területek: Customer profiling, Relationship profliling, whole market analytics
Az ember a párját általában gyakrabban, de rövidebb időre hívja, mint a barátait vagy kollégáit. Ez a minta azonosítható.
Hasonlóképpen profilozható a hívások hossza és ütemezése alapján a kapcsolatok más típusai is
A szociális hálók és a hivásminták alapján a nem ügyfeleket is lehet valamilyen mértékben elemezni
A hívások jellemzői alapján számos életszituáció azonosítható. Munkahely váltás, költözés, iskolakezdés, házasság, válás
Vége a Super Sessionnak, Kávészünet, aztán Advanced Analytics témák.
Kezdődik az Advanced Analytics User Group összejövetele. Témák: Big Data és az Aster Data akvizíció, majd panelbeszélgetés ügyfelekkel
Az Aster Data egy szoftverplatform, ami általános hardveren fut. SQL nyelvű feladatok masszívan párhuzamos végrehajtására képes
Számos különböző nyelven lehet programozni, Java, SQL, Perl, gyakorlatilag szinte minden, ami Linuxon fut
Számos olyan üzleti probléma van, ahol ilyen képességekre van szükség. Internetes, pénzügyi, kereskedelmi, média szektorból példák
Keresz-iparági példa: Digitális marketingtevékenység optimalizálása. Különböző forrásból érkező logadatok összefésülése, tranzakciók is
Példák: Csalásfelderítés online pókertermekben. Pénzmosás azonosítása
Az üzenet: A Teradata és az Aster Data együtt hatékonyan képes mind a relációs, mind a nem strukturált adatokat kezelni és elemezni
Panel kezdődik. Résztvevők: David May, Vodafone BI Development Manager. Malte Isacsson, Volvo Six Sigma Deployment Director.
Ken Hansen, Indicium Domain (tanácsadó), Todd J. Sylvester, Teradata
1. Kérdés: Mik legfontosabb fejlett analitikai üzleti problémák a cégnél? A kerekasztal résztvevőinek 30 másodperce van leírni a választ
Telco válasz: cross sell, segmentation, churn
Volvó: Minőségbiztosítás, csalásfelderítés
A PayPalnál is a csalásfelderítés és pénzmosás szerepel a legfontosabb témák között, mondja az az egyik résztvevő a teremben
2. kérdés: Mik a feljett analitika széles körű elterjedésének korlátai a vállalatoknál?
Fontosabb problémák: Adatintegráció, adatminőség, vezetőség támogatása, politikai kérdések
A Teradata felmérése szerint a legkomolyabb probléma az adatminőség, utána az elemzés bonyolultsága, aztán a vezetői támogatás hiánya
3. kérdés: Milyen adatfajták alapján készülnek a prediktív elemzések? Mik a legértékesebb adatfajták?
Válasz: A viselkedési adatok, szinte egyhangúan
A felmérés szerint a legfontosabb még a tranzakciós adatok, aztán demográfia, aztán viselkedési adatok
4. kérdés: Milyen hamar fog a vállalat Big Data jellegű adatforrásokat használni az elemzésekben?
Vodafone: tesztelés alatt, 1-2 éven belül igazi alkalmazás. Volvo: Próbaalkalmazások, kiterjesztés folyamatban
A tanácsadó szerint számos pilotprojekt van folyamatban különböző iparágakban
5. kérdés: A Big Data legfontosabb potenciális alkalmazási területei
Válaszok: Gazdagabb kockázati profilok, minőségbiztosítás, ügyfeladatok teljes körű kezelése, ajánlatok kidolgozása
A fókuszcsoportra épülő módszerek mellé kerül az adatelemzés is
Közönség szavaz a három legfontosabb témáról
A válaszok megoszlanak, népszerű az ügyféladat menedzsment
6. kérdés: Mik a fők akadályai annak, hogy a Big data által kínált lehetőségek üzleti hasznosításra kerüljenek?
Válaszok: Adatintegráció, változásmenedzsment, céges politika, vezetői támogatás, megértés hiánya, költségek
7. (utolsó) kérdés: Mit lehet/kelleni tenni a fejlett analitika sikeres felhasználása érdekében?
Válaszok: Sikertörténetek, az érték bizonyítása, további gyakorlati próbák, példák, oktatás
Nem szabad ragaszkodni a "tökéletes" adatokhoz
Véget ért az Advanced Analytics felhasználói találkozó.
Ezzel lezárul élő közvetítésünk Barcelonából, a Teradata európai konferenciájáról. Összefoglalónk hamarosan a bi.hu portálon lesz olvasható