*** Última actualización en diciembre de 2015 ***
Varias personas han producido datos y paisajes de aprendizaje automático.
De Shivon Zilis – Machine Intelligence:
- ¿Se permite el doble empleo en las empresas multinacionales de TI en la India?
- Finalmente estoy comenzando mi propio negocio 6 años después de graduarme ... Hice trabajos para afinar mis habilidades y creo que es hora, pero la competencia y la saturación me asustan ... ¿cómo lo supero y me lanzo?
- ¿Algún consejo para una deserción universitaria de 19 años? Acabo de abandonar la universidad para seguir una carrera en programación y establecer una nueva empresa tecnológica. Creo que es mejor pasar el tiempo y el dinero mejorando mis habilidades como programador y emprendedor.
- ¿Por qué un empresario que crea una empresa faculta a su junta para votarlo?
- ¿Por qué es que en India, incluso hoy, el perfil de trabajo más buscado es el proporcionado por Silicon Valley, CA, cuando tenemos nuestro propio Silicon Valley en Bangalore, y sin olvidar a Cyber Hubs como Hyderabad, Gurgaon, Gandhinagar, por nombrar algunos? ?
De Matt Turck:
Muchas startups usan big data debajo de sus aplicaciones, por supuesto, pero no están haciendo nada innovador en el frente de big data. Es útil restringir esta lista a las empresas que trabajan con una nueva tecnología, así como a proporcionar una nueva forma de servicio.
Las siguientes son algunas categorías sueltas y superpuestas …
Para el análisis en la base de datos (big data, no tradicionalmente en la nube, a menudo utilizando innovaciones de base de datos en columnas, y últimamente, Hadoop):
- Datos de aster
- Calpont
- ParAccel – ahora debajo de RedShift de AWS
- Ciruela verde
- Netezza
- Vertica
Tenga en cuenta que esta ola de startups se han adquirido (todas menos una) en los últimos años … Todavía considero estas startups de etapa tardía a pesar de que son casos límite.
En lugar de incluir una lista de bases de datos mucho, mucho más larga, solo lo referiré aquí:
Para análisis avanzados (minería de datos, aprendizaje automático, modelado sofisticado, simulación):
- Analítica continua
- Databricks
- KNIME
- Paradigma4
- PiCloud
- PLOM.IO – comercializado como Epy.io – hermoso lanzamiento, buena causa!
- Precog – recientemente adquirido por RichRelevance
- Revolution Analytics
- Cielo arbol
- Ufora
- Yhat
Desde mi experiencia en Ufora, el interés por las herramientas diseñadas para profesionales de análisis avanzado (codificadores, quants, investigadores, analistas, científicos de datos) se está calentando.
El análisis de regresión / clasificación / gráfico generalizado para aceptar datos únicos de una empresa, a veces con control guiado por GUI y menos codificación:
- Datos alpinos
- Alteryx
- Ayasdi
- BigML
- Contexto relevante
- Análisis de tormenta de lava
- Neo Technology
- tresata: análisis predictivo automatizado
Para combinaciones de SQL / NoSQL / Hadoop (big data verdadero, procesamiento de datos a gran escala, capacidades analíticas avanzadas a menudo limitadas) en la nube:
- Actian
- Datameer
- Hadapt
- Inktank / Ceph
- JethroData – “SQL completamente indexado en Hadoop:
- Platfora
- Splice Machine – “SQL en tiempo real en Hadoop”
- Zettaset
Herramientas NoSQL / Hadoop centradas en el desarrollador para gestionar big data:
- Cloudera
- Datastax
- Hortonworks
- Infochimps
- Karmasphere
- MapR
- Datos de mortero
- Qubole: “interfaz de usuario intuitiva para colmena, cerdo y MapReduce”
- Rainstor
- Sqrrl
Para búsqueda, visualización de datos, minería de datos básica y herramientas predictivas; a menudo usando otras soluciones NoSQL:
- Sistemas de centrifugado
- Razonamiento digital
- EdgeSpring
- LucidWorks
- Palantir – crecido fuera de la fase de “inicio”
- Tableau: también creció fuera de la fase de “inicio”
- Trifacta – fase de transformación de datos de ETL
Reventa de datos:
- DataSift
- Exversion
- Factual
- Quandl
- Topsy
GPU:
- Tecnologías SQREAM
Verticales específicos
Ad-Tech: plataformas del lado de la demanda
- Adchemy
- AppNexus
- PANTALLA DE MARCA
- DatXu
- Invitar a los medios
- Lucid Media
- MediaMath
- Triggit
- Giro
- X + 1
Ad-Tech: herramientas de optimización de marketing en línea
- Coremetrics
- Omniture
- RichRelevance
- Unica
Bio:
- Accelrys
- Affymetric
- Ariadne Genomics
- BioXpr
- DNAnexus
- Eagle Genomics
- Bioinformática de Ginebra
- IO Informática
- Tecnologías de la vida
- Genética espiral
- Theranos
- Tripos Discovery Informática
Ingeniería / monitoreo de desempeño:
- Concurix
- … mucho mas.
Finanzas (con énfasis en fintech en general):
- 1010data
- Arialytics
- QuantConnect
- Quantopian
Márketing:
- PivotLink
- Kontagent
- Clario
Otras listas de análisis y nuevas empresas de datos:
- 42 Startups de Big Data – Vote por los 10 mejores
- Colección de startups de datos en Pinterest
- Financiación de inicio de Big Data por proveedor
Algunos blogs útiles y estudios de mercado, aunque las startups son solo una parte de su enfoque:
El panorama de Big Data
Kurt Monash: http://www.dbms2.com/
Merv Adrian: http://blogs.gartner.com/merv-ad…
James Kobelius: http://blogs.forrester.com/blog/143
IDC: http://www.idc.com/
Intersect360: http://www.intersect360.com/
También vale la pena vigilar a las empresas establecidas, por supuesto. Oracle, SAP (HANA), Microsoft, IBM (SPSS), SAS, MathWorks, MicroStrategy, MarkLogic, TIBCO, etc., y empresas consultoras como Opera Solutions, Mu Sigma, Accenture. McKinsey, Bain, BCG y otras firmas consultoras estratégicas importantes están desarrollando prácticas analíticas avanzadas.