A Gartner elemzése a különböző feljövő technológiákat mutatja be.
A görbe első, emelkedő szakaszán találhatóak a legdivatosabb, legnépszerűbb újdonságok. Itt a csúcs közelében található például a machine learning (ML) és deep learning. Azonban az itt található technológiák a legtöbb esetben még átmennek egy kiábrándulási szakaszon, mielőtt elérnék a széles körű, praktikus alkalmazhatóság fennsíkját.
A fenti két esetben ehhez várhatóan 2-5 évre lesz még szükség, de például a görbén jelenleg kicsit előbbre tartó önvezető járművek esetén akár 10 év is lehet ez az idő.
Nyár végi válogatásunk az aktuális adatos álláshirdetésekből. A hirdetők között telekom és pénzügyi cégek, gyártó és kereskedelmi vállalatok valamint szoftverházak.
Az őszi szezon jó néhány izgalmas szakmai konferenciát kínál az adatok iránt érdeklődő szakembereknek, beharangozónkban ezek közül válogatunk.
Az SAP szeptember 10-12. között ismét Siófokon rendezi meg nagyszabású szakmai fórumát, immár 20. alkalommal. A programban többek között szerepelnek BI esettanulmányok a Bonafarm, a Scitec Nutrition és a Nemzeti Útdíjfizetési Szolgáltató Zrt-től.
Szeptember végén szintén Siófok ad otthont az idei Internet Hungary konferenciának, ahol több szekció is foglalkozik az online tevékenységek adatainak elemzésével.
Október közepén kerül megrendezésre a Prezi és az IBM Budapest Labs (ex-Ustream) szervezésében a data engineering és analytics témájú CrunchConf, amely idén is nagyon színvonalas nemzetközi előadógárdát hoz Budapestre.
November közepén lesz az idei Budapest BI Fórum, ahol az önkiszolgáló BI, az adatvizualizáció, a gépi tanulás valamint a PyData és az R ökoszisztémák lesznek a középpontban, számos hazai és külföldi esettanulmánnyal.
Közzétette a Hortonworks a június végén zárult negyedév pénzügyi adatait. A cég árbevétele 61,8 millió dollár volt, ami 42%-os növekedés az előző évhez képest.
A teljes 2017-es üzleti évre a cég jelenleg 247 millió dolláros árbevételt jelez előre. A tavalyi év zárásakor közétett becslés még csak 235-240 millió dollár volt.
A fontosabb üzleti hírek közé tartozik az IBM-mel júniusban kötött szövetség, amelynek keretében a kék óriás is forgalmazni fogja a Hortonworks Data Platform és a Data Flow termékvonalait. A Hortonworks peig adaptálni és forgalmazni fogja az IBM Data Science Experience (DSX) és Big SQL megoldásait.
Ez a megállapodás tovább erősíti a Hortonworks ipari kapcsolatait. A cég többek között a Microsoftnak is stratégiai partnere a Big Data megoldások területén.
Extra hosszú válogatásunk az aktuális adatos álláshirdetésekből. A hirdetők között ezúttal megtalálható számos bank és pénzintézet, telekom szolgáltatók, IT cégek valamint startupok.
A McKinsey Artificial Intelligence - The next Digital Frontier címmel publikált egy tanulmányt, amely a mesterséges intelligencia aktuális kérdéseivel foglalkozik.
A tanulmány szerint rekordmennyiségű pénz ömlik az AI fejlesztésekbe, de a tényleges alkalmazás még jóval alacsonyabb. Fontos kiemelni, hogy az invesztíció legnagyobb része belső céges fejlesztés, amelyben különösen a Google, a Facebook, az Amazon és az Apple jár az élen.
A tech óriások gyakran élnek az "Acquihire" eszközével is, azaz felvásárolnak ígéretes induló AI startupokat azzal a céllal, hogy magukhoz kössék a tehetséges szakembereket. A McKinsey becslése szerint egy-egy akvizíció 5-10 millió dolláros összeget jelent.
Az elemzés azt is állítja, hogy AI vezető alkalmazási területei között nem lesz változás, a jelenlegi élharcosok fogják vezetni a szektort. Hasonlóan a hagyományos adattárházas és BI alkalmazásokhoz, a pénzügyi és a telekom cégek lesznek
A teljes, számos további témával foglalkozó anyag letölthető a McKinsey oldaláról.
Ezen a héten rendezik Brüsszelben az useR!2017 konferenciát, amely az R statisztikai programozási nyelv felhasználóinak legnagyobb találkozója.
A témák között szerepel adatbányászat, adatvizualizáció, Big Data, klinikai alkalmazások, bioinformatika, statisztikai modellezés és még sok minden más.
Az önkiszolgáló BI és adatvizulizációs szoftvereket fejlesztő cég a jövőben nagyobb önálló verziók helyett rendszeres és gyakori frissítéseket fog kiadni.
Az új rendszerben meg fog változni a verziók elnevezése és számozása is, így például a Qlik Sense legfrissebb kiadása egyszerűen a June 2017 címkét kapta. A következő verzió a 10 hét múlva érkező szeptemberi lesz, majd újabb 10 hét múlva jön majd a novemberi frissítés is.
A Qlik Sense júniusi kiadása számos érdekes új vagy továbbfejlesztett funkciót hozott, ilyen például a vizuális adatprofilozás, új grafikontípusok vagy az R és Python integráció.
Az újdonságok listájáról itt lehet bővebben olvasni. A jövő szerdai BI meetupon is szó lesz a Qlik újdonságokról, valamint bemutatásra kerül egy Qlik Sense - R integrációs projekt is. A meetupra itt lehet jelentkezni.
A Kinetica indulása az amerikai hírszerzés környékére vezethető vissza, ahol néhány évvel ezelőtt nagy szükség volt egy valós időben működő, nagy teljesítményű adatfeldolgozó platformra. Az akkori megoldásokat nem találták megfelelőnek, ezért egy új, GPU alapú adatbázist kezdtek fejleszteni.
A Kinetica a GPU-k sebességének és masszívan párhuzamos működésének köszönhetően a hagyományos DB-khez képest bizonyos esetekben akár 1-2 nagyságrenddel is gyorsabb. A cég csak a szoftvert fejleszti, a hardvert pedig olyan neves partnerek biztosítják, mint az IBM. A Kinetica elérhető a vezető felhőszolgáltatók platformjain is, akik szintén kínálnak nagy teljesítményű GPU-kkal felszerelt virtuális szervereket.
A Kinetica teljesítménye (a cég saját mérése)
A most bejelentett tőkebevonással 50 millió dollárhoz jut a cég, amelyet főleg termékfejlesztésre és további terjeszkedésre fordítanak. Eddig két körben 13 milliót kaptak, így most közel megnégyszereződtek a rendelkezésre álló források.
A GPU alapú adatbázis az utóbbi években erősen feljövőben vannak, hasonló technológián dolgozik többek között a SQReam és a MapD is. Az utóbbi közreműködésével jött létre idén tavasszal a GPU analitika könnyebb alkamlmazását segítő GPU Open Analytics Initiative, amelyben a Continuum Analytics és a H2O.AI is partnerek.
Idén kilencedik alkalommal került megrendezésre az adattárházakkal és Big Data megoldásokkal foglalkozó hazai szakembereknek szóló Budapest Data konferencia. A háromnapos esemény idén rekordszámú résztvevőt vonzott, összesen közel kétszázötvenen vettek részt a programokon.
Készülődés
Big Data és Data Science A hétfői workshop napon a MongoDB használatával, a Hadoopon elérhető legmodernebb Hive/SQL technológiákkal és a Google felhőben futó Big Data megoldásokkal ismerkedhettek meg a résztvevők közelebbről. A workshopok lebonyolításában az Appworks, a Hortonworks és a Doctusoft szakértői működtek közre.
A Forrester frissen megjelent elemzése a nagyvállalati adattárházak és Big Data platformok szállítóit hasonlítja össze.
Az összesen 15 szállítót vizsgáló Big Data Warehouse elemzés 6 céget sorol a vezetők közé, ezek az Amazon, a Hortonworks, az IBM, az Oracle, a SAP és a Teradata.
Jól szerepelnek a Cloudera részvényei a tőzsdén, az árfolyam jelentősen emelkedett a kereskedés első napja óta.
A Cloudera előzetesen 12-14 dolláros kibocsátási árfolyamot jelölt meg, amiből végül 15 dollár lett. Ez a kibocsátási árfolyam jelentősen kisebb cégértéket mutat, mint amit az Intel 2014-es 740 millió dolláros befektetése jelzett. Az akkori 4.1 milliárd dollárhoz képest a mostani IPO 'csak' 1,9 milliárd dolláros cégértéket jelent.
A tőzsdei kereskedés első napján a részvény 20 százalékot emelkedett, 18 dollárra. A pozitív trend azóta is folytatódott, két hét után az árfolyam 20 dollár felett jár, az aktuális cégérték pedig 2.6 milliárd dollár körül van.
A tavalyi évhez hasonlóan a vezetők között szerepel az IBM, a Microsoft és az SAP is, újdonság viszont az Amazon Web Services (AWS) előkelő helyezése.
Teljesen új szereplők még idén a Google, az EnterpriseDB, a Snowflake és a Huawei. A régebbi játékosok közül viszont kikerült az Actian, az Exasol, a Hitachi, a Kognitio és az Infobright, inaktivitás vagy a bevételi követelmények (40 millió dolláros éves árbevétel vagy 10 millió dollár 50 százalékos növekedés mellett) nem teljesítése miatt.
Hosszú várakozás után bejelentette a Cloudera, hogy megjelenik a tőzsdén. A részvénykibocsátás keretében körülbelül 200 millió dollár tőkét terveznek bevonni.
A 2008-ban alapított Cloudera történetének legfontosabb mérföldköveit az alábbi ábra mutatja be.
A cég eddig nem nagyon tett közzé részletes pénzügyi adatokat, azonban a tőzsdei részvénykibocsátásához szükséges S1 dokumentumból kiderülnek a legfontosabb mutatók, amelyeket a legfőbb versenytársnak számító Hortonworks számaival is összevethetünk.
A bevételi adatokból jól látható, hogy a Cloudera továbbra is erős növekedési pályán van, a 2017. január 31-én zárult pénzügyi évben 261 millió dolláros bevételt ért el, ami 57%-kal haladja meg az előző évit. A Hortonworks hasonló adata 184 millió dollár, nagyjából azonos növekedési ráta mellett.
Az eredményességet nézve a Cloudera is jócskán veszteséget termel még, azonban 2016-ban már elindult a veszteség csökkenése, míg a Hortonworksnál egyenlőre ellenkező irányú a trend. Árbevétel arányosan is jóval kedvezőbb így a Cloudera helyzete (70%, illetve 130% a bevételarányos veszteség).
A Hortonworks jelenlegi mutatói nagyjából a Cloudera tavalyi számaival egyeznek meg, ezért érdemes lesz nyomon követni, 2017-ben hogyan muzsikál a két cég.
Az adatvizualizációs piac meghatározó szereplői közé tartozó cég mostantól alapvetően előfizetéses konstrukcióban kínálja szoftvereit.
Az új árazás szerint a Desktop Professional szoftver havi 70 dollár lesz az eddigi egyszeri 2.000 dollár helyett. Figyelembe véve az éves szoftverkövetést is, az előfizetés díjak így nagyjából 3-4 év után kerülnek egyensúlyba az egyszeri vásárlás költségeivel.
A Tableau az új árazástól azt várja, hogy a felhasználók sokkal könnyebben tudnak majd indítani új elemzési projekteket, hiszen nem kell egyszeri nagyobb beruházás a szoftverek beszerzéséhez. Hasonlóképpen könnyebb lesz majd újabb felhasználókkal bővíteni egy már meglévő BI rendszert is.
Aktuális válogatásunk a hazai adatos álláshirdetésekből. A hirdetők között az UPC, a Balabit, a Bosch, a Netpincér, a Hortonworks, a Fundamenta, az MKB és a Spicy Analytics.
A Forrester Research új elemzést készített az adatok előkészítését és feldolgozását az üzleti felhasználók számára is lehetővé tévő adatpreparációs szoftverekről.
Az elemzés szerint a vezetők csoportjába jelenleg két cég tartozik, a Trifacta és a Paxata.
The Forrester Wave™: Data Preparation Tools, Q1 2017
Mindkét szoftverre jellemző, hogy a hagyományos adatforrások mellett támogatják az olyan Big Data eszközöket is, mint a Hadoop és a Spark. Az adattisztítási feladatokat intelligens algoritmusokkal is segítik és lehetőséget adnak az adatok profilozására is.
A hét céget bemutató elemzésben szerepel még a SAS, az Alteryx, a DataWatch, az Oracle és az Unifi.
A teljes elemzés ingyenes regisztráció után letölthető a Trifacta vagy a Paxata weboldaláról.
A most zajló Cloud Next konferencián jelentette be a Google, hogy felvásárolja az adatbányászati versenyek szervezésről ismert Kaggle-t.
A Kaggle hét évvel ezelőtt indult, az Eurovision dalverseny szavazási mintáit vizsgáló első kiírásban 21 csapat küzdött az 1.000 dolláros díjért. Azóta a platformnak több százezer felhasználója van, és rengeteg különböző data mining versenyt rendezett üzleti, tudományos és toborzási célokból.
A Kaggle blogposztja szerint továbbra is önállóságukat és saját arculatukat megőrizve fognak működni a Google berkein belül is.
Az Alteryx az önkiszolgáló adatelemzés piacának egyik vezető szereplője. A cég workflow-alapú szoftvere lehetővé teszi, hogy az üzleti felhasználók önállóan végezzenek el különböző elemzési feladatokat, az adatok előkészítésétől a komplex térképes elemzésekig és prediktív analitikáig.
Az amerikai tőzsdefelügyelethez most beadott S-1 úrlap adataiból kiderül, hogy az Alteryx az elmúlt két évben dinamikusan növelte az árbevételét, a 2014-es 39 millióról több mint 85 millióra.
A cég eladási stratégiája a más szállítóktól is ismert 'land and expand' modellt követi, azaz az ügyfelek jellemzően egy kisebb, akár csak egy licenszes beszerzéssel kezdenek, amit aztán újabb és újabb megrendelések követnek. Ehhez természetesen az kell, hogy a szoftver a valós használatban kellően sikeresnek bizonyuljon.
Az Alteryx a Gartner aktuális mágikus négyzeteiben is helyet kapott, a Data Science MQ-ban a kihívók között, a BI MQ-ban pedig a bal alsó sarokban.
A gyors növekedésnek itt is megvan az ára, az eddig kockázati tőkéből finanszírozott cég évente 20 millió dollár feletti veszteséget termelt. A kiadások között a legnagyobb tétel nem meglepő módon az értékesítési és marketing költségek.
Szerencsére a cég bőségesen el van látva tőkével, a TechCrunch adatait szerint eddig három fordulóban összesen 163 millió dollárnyi befektetést kapott.
A tervezett nyilvános kibocsátásból a cég mintegy 75 millió dollárnyi friss pénzre számít. A részvények várhatóan az AYX szimbólum alatt fognak szerepelni a tőzsdén.
A Clementine Consulting elemzői szöveganalitikai eszközök segítségével interaktív Google térképre gyűjtötték össze a március másodikai Torkos Csütörtök akcióban résztvevő éttermeket.
A tetszés szerint nagyítható interaktív verzió itt érhető el, a Clementine oldalán pedig a részvevő éttermek listája is megtalálható.
Megjelent a Gartner adatbámyászati és data science platformokat bemutató elemzése is. Az élbolyban az IBM, a SAS, a RapidMiner és a Knime.
Gartner Magic Quadrant for Data Science Platforms, February 2017
A Gartner korábban az Advanced Analytics Platforms MQ-ban foglalkozott ezekkel a cégekkel (itt a tavalyi), idén azonban átkeresztelte az elemzést. A bekerülési kritériumok módosulásával szélesebb lett a merítés is, így most már 16 cég szerepel a mágikus négyzetben, köztük kisebb, innovatív szállítók is.
A vezetők között csak kisebb változások történtek, helyet cserélt az IBM és a SAS, illetve a Rapidminer és a Knime is. Érdekesség, hogy mind a 4 vezető cég közel azonos értékelést kapott a végrehajtási képesség tengelyén. Új szereplő nincsen, a tavalyi vezetők közül pedig egyedül a november óta már a Quest portfóliójába tartozó Dell/Statistica került át a kihívók közé.
A további negyedekben elég sok a változás a módosított kritériumok miatt. Új szereplő a Dataiku, a Domino Data Labs, H2O.ai, a MathWorks és a Teradata. Eltűntek viszont olyan régi, de kisebb szereplők, mint a Megaputer vagy a Predixion Software.
Ha a legjobb filmet a kritikusok véleménye alapján választjuk ki, akkor biztos nem.
A BBC grafikonja az utóbbi években a legjobb film díját elnyerő alkotások kritikusi pontszámait mutatja be.
Forrás: BBC
Jól látható, hogy a közelmúltban csak három díjnyertes film kapott kiemelkedőn jó összesített értékelést a MetaCritic gyűjtőoldalon. Az Oscart hazavivő filmek nagy része azért persze jól szerepelt, nem maradt le sokkal a legjobban értékelt 3 film átlagát mutató piros vonaltól.
2016-ban is jelentősen növelte árbevételét a Tableau. Az éves összbevétel 827 millió dollárra rúgott, ami 27 százalékos bővülés az előző évhez képest. A licenszbevétel 482 millió dollár volt, ami 14 százalékos éves növekedést mutat.
Megjelent a Gartner legújabb elemzése az üzleti intelligencia szoftverekről, ahol a tavalyi évhez hasonlóan ismét a Tableau, a Microsoft és a Qlik szerepel a vezetők negyedében.
Gartner Magic Quadrant for Business Intelligence and Analytics Platforms 2017
A Hortonworks 2016-ban több mint 50 százalékkal növelte árbevételét, amely meghaladta a 184 millió dollárt. A bevétel nagyjából kétharmada származott support előfizetésekből, a maradék egyharmad pedig szolgáltatásokból.
Ma tartja első találkozóját az R-Ladies Budapest meetup, az adatelemzés és adatbányászat iránt érdeklődő lányok/nőknek szóló szakmai csoport.
A budapesti tagozat a globális R-Ladies kezdeményezés része, amely már több tucatnyi országban van jelen hasonló meetupok révén. Az R-Ladies Budapest meetup oldala itt található, emellett elérhetőek a Facebook és a Twitter felületén is.
Létezik egy hasonló kezdeményes a Python nyelv kedvelői számára is, a PyLadies, amelynek szintén van hazai csoportja.
A Google a nagy nyilvánosság számára is elérhetővé tette globális méretekben is skálázható tranzakciós adatbázisát.
A Google Spanner kiemelkedő jellemzője, hogy úgy nyújt valódi tranzakciókezelést, hogy közben sem a nagyfokú skálázhatóságot, sem a hibatűrést nem áldozza fel.
Az elosztott adatbázisok működését leíró CAP elmélet szerint a Consisteny (konszisztencia), Availability (elérhetőség), Partition tolerance (kb. particióvesztés-állóság) hármasából egyszerre csak kettő érhető el. Ezért olyan adatbázist készíteni szinte lehetetlen, ami konzisztensen kezeli a tranzakciókat, tetszés szerint skálázható akárhány gépre, és közben bármikor elérhető.
A Spanner ezt az ellentmondást úgy oldja fel, hogy teljes egészében a Google által működtetett belső, redundáns hálózati infrastruktúrán fut. Ennek következtében a hálózati szakadásokból származó problémák nagyon-nagyon ritkák, a Google szerint a rendelkezésre állás 5 kilences nagyságrendű. Így szigorúan véve a Spanner a CP kategóriába tartozik (konzisztens és particióvesztés-tűrő), egy kiemelkedően magas, bár nem 100%-os elérhetőség mellett.
A Spanner működéséről érdekes részlettel szolgál a Quizlet blogja is, akik korai felhasználóként alapos és részletes teszteket futtattak.
A Google a Spannert már közel tív éve fejleszti, az első nyilvános technikai leírás 2012-ben jelent meg. Most közzétettek egy új tanulmányt is, amely többek között a particiószakadás kezelésével foglalkozik. A cég legkritikusabb üzleti alkalmazásai mára a Spanneren futnak, ideértve az Adwords és a Google Play szolgáltatásokat.
A német #Rosen (rózsa) taggal az Instagrammra posztolt képekek elemezte egy német csapat. Az adatgyűjtés a 2013 és 2015 közöttti időszakra vonatkozott.
68 éves korában elhunyt Hans Rosling, akinek a világ fejlődéséről szóló statisztikai és adatvizualizációs előadásait milliók látták.
A svéd Karolinksa Intézet közegészségüggyel foglalkozó professzorát 2006-os A The best stats you've ever seen TED előadásával ismerte meg a világ. Nevéhez fűződik a Gapminder alapítvány, amelynek az utolsó évtizedet szentelte.
Munkásságából ízelítőt ad a BBC4 csatorna számára készített, mindössze 4 perces dokumentumfilmje, a Joys of Stats is:
A Teradata 2016-os árbevétele 2,3 milliárd dollár volt. Ez 8 százalékos csökkenés a 2015-ös 2,5 milliárdhoz képest, azonban a különbség jelentős része abból származik, hogy tavaly júniusban a cég eladta marketingoptimizációs üzletágát.
Ismét visszatér a hazai adatos szakembereknek szóló állásokból válogató összeállításunk. A hirdetők között megtalálható az Erste Bank, az MBK Bank, a Telenor, a Generali Biztosító, a Vodafone, az UPC és az Oktatási Hivatal is.
A pittsburgi Rivers Casino-ban négy profi játékos mérte össze erejét a pókert játszó mesterséges intellienciával. A mérkőzést páros verseny formájában bonyolították, azaz a gép egyesével játszott emberi ellenfeleivel.
Fotó: Ross Mantle for Bloomberg Businessweek
A Carnegie Mellon University tudósai által fejlesztett Libratus a többhetes játék alatt jókora zsetonelőnyt szedett össze, a 4 profi pedig mind mínuszban végzett.
Ehhez hasonló eredményet eddig nem sikerült még számítógépnek emberi ellenfelek ellen elérni.A pókert különösen nehezen algoritmizálható feladatnak tartják, mert a játékosok csak korlátozott információkkal rendelkelnek.
A 2016-os évben a Microstrategy árbevétele 512 millió dollár volt, ami 3 százalékos csökkenés az előző évhez képest. A cég az elmúlt években rendre 500 és 600 millió dollár között teljesített.
Az új fejlesztés lehetővé teszi a PowerBI Desktopban készült elemzések publikálását egy helyi szerveren futó Reporting Services felületre.
Eddig a PowerBI adatvizualizációit csak a Microsoft felhőszolgáltatásával lehetett böngészőből is elérhetővé tenni és megosztani más felhasználókkal, ami nem mindenhol járható út.
Emlitésre érdemes, hogy új előzetes jelenleg csak az Analysis Services modellekhez ad hozzáférést, relációs (SQL) forrásokhoz még nem. A végleges verzió az év közepére várható.
A tavalyi évben is folytatódott a SAS több évtizedes töretlen növekedési sorozata. Az analitikai óriás tíz éve, 2007-ben lépte át a 2 milliárd dolláros árbevételi határt, 2013-ban pedig a hárommilliárdosat.
A 2016-os árbevétel 3,2 milliárd dollárra rúgott, ami 1,3%-os növekedés az előző évhez képest, illetve 4 százalékos, ha a dollár árfolyamváltozásának hatását kiszűrjük.
Az Evan Sinar által készített összeállítás a tavalyi év legérdekesebb írásait szemlézi.
39 studies about human perception in 30 minutes, Kennedy Elliott
A válogatásban helyet kaptak az emberi érzékeléssel, az adatvizualizáció etikai kérdéseival vagy éppen a tipográfia lehetőségeivel foglalkozó cikkek is.
A cég becslése szerint a 2016-os árbevétele elérte a 2 milliárd forintot, ami 67%-os növekedés az előző évi 1,25 milliárd forinthoz képest. A bevétel mintegy 70 százaléka származik külföldről, a megrendelők között szerepel az Apple, a Walt Disney, a Facebook és a Netflix.