Por Jeff Kelly con David Vellante y David Floyer - Wikibon
Este es el informe de 2011, publicado originalmente el 15 de febrero de 2012. Ver Big Data Vendor Ingresos y Pronóstico del Mercado 2012-2017 para la actualización de 2012.
El mercado de Big Data está al borde de una etapa de crecimiento rápido que verlo superar la marca de 50 mil millones dólares en todo el mundo en los próximos cinco años.
A principios de 2012, el mercado de Big Data se sitúa en poco más de 5000 millones dólares basado en el software relacionado, hardware, y los ingresos por servicios. Mayor interés y conciencia del poder de Big Data y capacidades analíticas relacionadas para obtener una ventaja competitiva y mejorar la eficiencia operativa, junto con la evolución de las tecnologías y servicios que hacen los grandes datos en una realidad práctica, dará lugar a una tasa compuesta anual súper cargado de 58% de aquí a 2016.
Como se explica en nuestro Data Manifiesto de Big, Big Data es la nueva fuente definitiva de ventaja competitiva en todas las industrias. Para aquellas organizaciones que comprender y aceptar la nueva realidad de Big Data, las posibilidades de innovación, una mayor agilidad y una mayor rentabilidad son casi infinitas.
A continuación se muestra el pronóstico de cinco años de Wikibon para el mercado de los grandes datos en su conjunto:
Figura 1 - Fuente: Wikibon 2012
Del mercado actual, Big Data proveedores pure-play representan 480 millones de dólares en ingresos. A pesar de su relativamente pequeño porcentaje de la corriente de ingresos general (aproximadamente 10%), estos vendedores - como Vertica, Splunk y Cloudera - son responsables de la gran mayoría de las nuevas innovaciones y enfoques modernos de la gestión de datos y análisis que han surgido en la última varios años y hecho grandes datos del sector más caliente de TI.
Wikibon considera Big Data puros de papeles como los de hardware, proveedores de software, o servicios independientes cuyas relacionadas con los datos de Big cuentas de ingresos para el 50% o más de los ingresos totales. Este grupo también se compone de tres hasta hace poco independiente proveedores de almacenamiento de datos de próxima generación - HP Vertica, Teradata Aster, y EMC Greenplum - que en gran medida continuará operando como entidades autónomas y no tiene, hasta el momento, tenía su ADN contaminado por sus adquirentes .
A continuación se muestra un desglose de los ingresos a nivel mundial de los mejores Big Data proveedores pure-play para el año 2011. *
Figura 2 - Fuente: Wikibon 2012
A continuación se muestra un desglose de la cuota de mercado en el segmento de puro juego del mercado de Big Data.
Figura 3 - Fuente: Wikibon 2012
Los actuales líderes del mercado Big Data, por ingresos, son IBM, Intel y HP, estas mega proveedores se enfrentarán a una mayor competencia de los proveedores de las empresas establecidas, así como los antes mencionados Big Data puros-plays en desarrollo tecnologías Big Data y casos de uso que están impulsando el mercado . Incumbe a Hadoop centrado puros-plays, sin embargo, establecer un modelo de negocio rentable para comercializar el marco de código abierto y el software relacionado, que hasta la fecha ha sido difícil de alcanzar.
A continuación se muestra un desglose de la corriente de los ingresos totales Big Data por el proveedor **:
Vendor | Big Data Revenue (in $US millions) | Total Revenue (in $US millions) | Big Data Revenue as Percentage of Total Revenue |
IBM | $953 | $106,000 | 1% |
Intel | $765 | $54,000 | 1% |
HP | $513 | $126,000 | 0% |
Fujitsu | $285 | $50,700 | 1% |
Accenture | $273 | $21,900 | 0% |
CSC | $160 | $16,200 | 1% |
Dell | $154 | $61,000 | 0% |
Seagate | $149 | $11,600 | 1% |
EMC | $138 | $19,000 | 1% |
Teradata | $120 | $2,200 | 5% |
Amazon Web Services | $116 | $650 | 18% |
SAS Institute | $115 | $2,700 | 1% |
Capgemini | $111 | $12,100 | 1% |
Hitachi | $110 | $100,000 | 0% |
SAP | $85 | $17,000 | 0% |
Opera Solutions | $76 | $100 | 76% |
NetApp | $75 | $5,000 | 0% |
Atos S.A. | $75 | $7,400 | 1% |
Huawei | $73 | $21,800 | 0% |
Siemens | $69 | $102,000 | 0% |
Xerox | $67 | $6,700 | 1% |
Tata Consultancy Services | $61 | $6,300 | 1% |
SGI | $60 | $690 | 9% |
Logica | $60 | $6000 | 1% |
Mu Sigma | $55 | $65 | 85% |
Microsoft | $50 | $70,000 | 0% |
Oracle | $50 | $36,000 | 0% |
Splunk | $45 | $63 | 68% |
1010data | $25 | $30 | 83% |
Supermicro | $23 | $943 | 2% |
MarkLogic | $20 | $80 | 25% |
Cloudera | $18 | $18 | 100% |
Red Hat | $18 | $1,100 | 2% |
Informatica | $17 | $750 | 2% |
Calpont | $15 | $25 | 60% |
ClickFox | $11 | $35 | 31% |
Fractal Analytics | $12 | $12 | 100% |
Pervasive Software | $10 | $50 | 20% |
Tableau Software | $10 | $72 | 14% |
Think Big Analytics | $8 | $8 | 100% |
MapR | $7 | $7 | 100% |
Digital Reasoning | $6 | $6 | 100% |
ParAccel | $5 | $11 | 45% |
Couchbase | $5 | $6 | 84% |
DataStax | $4.5 | $4.5 | 100% |
10gen | $4.5 | $4.5 | 100% |
Datameer | $4 | $4 | 100% |
Hortonworks | $3 | $3 | 100% |
RainStor | $2.5 | $2.5 | 100% |
Attivio | $2.5 | $19 | 13% |
QlikTech | $2 | $300 | 1% |
HPCC Systems | $2 | $2 | 100% |
Karmasphere | $2 | $2 | 100% |
Other | $25 | n/a | n/a% |
Total | $5,125 | $866,671 | 1% |
- Intel, Seagate y Super Micro tienen grandes acciones debido a la propensión de datos de gran escala los racimos de utilizar componentes off-the-shelf y soluciones de caja blanca. Esto es especialmente cierto para los gigantes de Internet como Google y Facebook.
- Fuerte presencia de IBM incluye una gran proporción de los servicios debido a la fuerte cartera de servicios profesionales de la empresa. Además, la fuerte negocio de software de análisis de IBM es un gran contribuyente a sus iniciativas de Big Data.
- Cifras de Oracle Exadata y Exalogic incluyen porque son enfoques no tradicionales para el manejo de datos de gran tamaño. Sin embargo, no se incluye el conjunto de ingresos de estos productos. Se valoran los ingresos que se asociaron con implementaciones que eran grandes en capacidad.
- La generación de ingresos de la empresa proveedor de almacenamiento de datos siguiente de Vertica, Greenplum, y Aster Data se incluyó en las cifras de ingresos Big Data generales de su empresa matriz.
Wikibon inició esta investigación en un esfuerzo por proporcionar alguna orientación a la comunidad sobre el tamaño del mercado de Big Data. Todo el mundo está zumbando sobre Big Data, que lleva a la pregunta: "¿Qué tan grande es el mercado de Big Data" Se realizaron búsquedas pero no pudimos encontrar ninguna información de mercado y sentimos que poner adelante a tops / abajo y fondos / hasta el análisis sería útil. Poner una "estaca en la tierra 'en el tamaño del mercado también, esperamos, generar nuevos debates en la comunidad y ayudarnos a afinar las estimaciones del mercado. Toda la entrada creíble será evaluado y actuar en consecuencia rápidamente.
En cuanto a la metodología, el tamaño del mercado de Big Data, pronóstico, y los datos de cuota de mercado relacionados se determinó con base en una extensa investigación de las cifras de ingresos públicos, informes de prensa, entrevistas con los proveedores y revendedores en relación con las tuberías de clientes, hojas de ruta de productos, y la retroalimentación de la comunidad de Wikibon los profesionales de TI. Muchos vendedores no fueron capaces o dispuestos a proporcionar cifras exactas para nuestra definición Big Data, y porque muchos de los puros de papeles son de propiedad privada era necesario que Wikibon para triangular muchas fuentes de información para determinar nuestras cifras finales. Wikibon define los grandes datos para incluir conjuntos de datos cuyo tamaño y tipo que sean impracticables para procesar y analizar con las tecnologías de bases de datos tradicionales y herramientas relacionadas. El mercado de datos grande, por lo tanto, incluye las tecnologías, herramientas y servicios diseñados para hacer frente a estas deficiencias. Éstas incluyen:
- Hadoop distribuciones, software, subproyectos y hardware relacionado;
- La próxima generación de almacenes de datos y hardware relacionado;
- Big data plataformas analíticas y aplicaciones;
- Plataformas y aplicaciones de inteligencia de negocios, minería de datos y visualización de datos que se aplican a los grandes datos;
- Plataformas de integración de datos y herramientas que se aplican a los grandes datos;
- Apoyo Big Data, capacitación y servicios profesionales.
Si bien esta es una definición ciertamente amplio mercado, la mayoría de las tecnologías y herramientas básicas Big Data comparten alguna combinación de las siguientes características. Se aprovechan de hardware común para permitir scale-out, técnicas de procesamiento en paralelo; emplear a un cierto nivel de modelo de datos no relacionales con el fin de procesar los datos no estructurados y semi-estructurados; aprovechar el almacenamiento de datos en columnas y / o capacidades de compresión de datos para mejorar la eficiencia de la consulta; y son interoperables con análisis de negocios y tecnologías de visualización de datos para transmitir conocimientos a los usuarios finales.
A continuación se muestra un desglose de los ingresos Big Data por el hardware, software y servicios.
Figura 4 - Fuente: Wikibon 2012
Pure-plays desarrollo de la innovación Big Data
Mientras que los pesos pesados de TI de IBM e Intel actualmente liderando el mercado de Big Data en los ingresos en general, esto se debe principalmente a su amplitud de ofertas y atrincheramiento en muchos centros de datos empresariales, y, en el caso de Intel, la propensión de los proyectos de Big Data para utilizar los productos básicos x / 86 servidores. Además, el énfasis de IBM en análisis y su cartera de grandes servicios están impulsando gran parte de los ingresos de datos grande de la compañía. Por otra parte, el mercado es inmaduro, con pequeños Big Data puros-plays sólo el aumento gradual de sus estrategias de salida al mercado.Las innovaciones de mayor impacto en el mercado de grandes volúmenes de datos son, de hecho, que viene de los numerosos vendedores pure-play que, a partir de ahora, sólo poseen una pequeña participación en el mercado global. Si bien no todos van a tener éxito en el largo plazo, y sin embargo, algunos tienen que entregar ningún ingreso significativo, Wikibon espera que muchos de estos vendedores disfrutando de un rápido crecimiento en los próximos cinco años como sus ofertas, servicios de apoyo, y los canales de venta madurar. Por supuesto, esto también significa todos y cada uno de puro juego Big Data es un objetivo de adquisición potencial de mega proveedores de IBM, Oracle, HP, EMC, y otros. Como ha sucedido en otros mercados de rápido crecimiento, como el mercado de Business Intelligence en el período 2007-2008, el mercado de Big Data experimentará una consolidación significativa en los próximos tres a cinco años. Los vendedores de la adquisición sería prudente permitir actuales Big Data puros-plays para seguir operando y, más importante, innovando como entidades mayormente independientes, o el riesgo de sofocar la innovación que muy está alimentando un enorme crecimiento del mercado de datos grande.
A continuación se presentan ejemplos específicos de las innovaciones que están siendo impulsados por grandes datos puros de roles:
Distribuciones de Hadoop Cloudera y Hortonworks son responsables de la mayoría de las contribuciones al proyecto Apache Hadoop que mejoran significativamente las capacidades de rendimiento de la fuente abierta del marco Big Data y la empresa de preparación.
Cloudera, por ejemplo, contribuye significativamente a Apache HBase, la base de datos no relacional basada en Hadoop que permite la baja latencia, búsquedas rápidas. La última de estas iteraciones, a la que los ingenieros de Cloudera contribuyeron, es v2 hFile, una serie de parches que mejoran la eficiencia de almacenamiento HBase.
Hortonworks ingenieros están trabajando en una arquitectura de próxima generación MapReduce que promete aumentar el tamaño máximo de clúster Hadoop más allá de su actual limitación práctica de 4.000 nodos, así como añadir un cierto nivel de transmisión en tiempo real las capacidades de análisis de datos.
MapR tiene un enfoque más propio para Hadoop, que complementa HDFS con su compatible con la API de DirectAccess NFS en su distribución de Hadoop empresa, añadiendo capacidades significativas de rendimiento y tiempo de actividad.
Next Generation Data Warehousing Los tres líderes, hasta hace poco independientes proveedores de almacenamiento de datos de próxima generación - Vertica, Greenplum, y Aster Data - están dando un vuelco al mercado tradicional de almacenamiento de datos empresariales con bases de datos analíticas masivamente paralelas, columnares que entregan aligerar la carga de datos rápido y casi real capacidades de consulta de tiempo.
La última versión de la Vertica Analytic Platform, Vertica 5.0, por ejemplo, incluye nuevas capacidades de elasticidad para expandir fácilmente o implementación de contratos y un montón de nuevas funciones analíticas en la base de datos.
Aster Data ha sido pionero en un marco de SQL-MapReduce novela, que combina lo mejor de ambos enfoques de tratamiento de datos, en tanto que única plataforma analítica de colaboración de Greenplum, Chorus, ofrece un entorno social para científicos de datos para experimentar con Big Data.
Los tres proveedores experimentaron un crecimiento significativo de los ingresos en los últimos dos o tres años, con Vertica a la cabeza con un estimado de $ 84 millones en ingresos en 2011, seguido de Aster Data, con 52 millones de dólares y Greenplum con $ 40 millones.
Plataformas y aplicaciones Big Data Analytic Un puñado de up-and-coming proveedores están desarrollando aplicaciones y plataformas que aprovechan la infraestructura Hadoop subyacente para proporcionar tanto a los científicos de datos y usuarios de negocios "regulares" con herramientas fáciles de usar para la experimentación de Big Data. Menos madura es el mercado de pulido a los usuarios finales aplicaciones Big Data.
Datameer está ganando tracción significativa con su plataforma de inteligencia de negocio basado en Hadoop que aprovecha una interfaz de hoja de cálculo familiar para permitir a los usuarios sin motor para manipular o analizar datos basada en Hadoop de otra manera; Razonamiento Digital, cuya plataforma de síntesis se encuentra en la parte superior de Hadoop para analizar la comunicación basada en texto, está muy arraigado en el sector gubernamental y está lista para expandir a las empresas más tradicionales. Karmasphere ha desarrollado una plataforma de desarrollo analítico que permite a los científicos datos para realizar consultas ad hoc sobre datos basados en Hadoop través de una interfaz SQL.
Big-Data-as-a-Service Big-Data-as-a-Service se está desarrollando rápidamente gracias a proveedores como Tresata, 1010data y ClickFox. Aplicaciones y servicios de Big Data en la nube tienen el potencial de permitir que las pequeñas y medianas empresas, así como las empresas que carecen de conocimientos técnicos internos Big Data, para aprovechar el procesamiento de grandes volúmenes de datos y capacidades analíticas sin necesidad de desplegar y gestionar en las instalaciones hardware o software.
Plataforma basada en la nube de Tresata, por ejemplo, aprovecha Hadoop para procesar y analizar grandes volúmenes de sus clientes los datos financieros, incluyendo enriqueciéndola con datos de terceros, tales como los datos del mercado de valores y devuelve los resultados a través de on-demand visualizaciones para los bancos, los datos financieros empresas y otras compañías de servicios financieros.
1010data ofrece una aplicación basada en la nube que permite a los usuarios de negocios y analistas para manipular datos en el formato de hoja de cálculo familiar, pero a escala Big Data. Y las minas plataforma ClickFox grandes volúmenes de datos de punto de contacto del cliente para asignar la experiencia total del cliente con efectos visuales y análisis entregados bajo demanda.
Plataformas no Hadoop Big Data Otros proveedores no Hadoop contribuyen innovación significativa a la gran paisaje datos incluyen:
- Splunk, que se especializa en el procesamiento de datos y el análisis de archivos de registro para permitir a los administradores supervisar el desempeño de TI de infraestructura e identificar los cuellos de botella y otras interrupciones en el servicio;
- HPCC Systems, una spin-off de LexisNexis, que ofrece un marco de Big Data compitiendo para Hadoop que sus ingenieros construyen internamente en los últimos diez años para ayudar a la empresa en el procesamiento y análisis de grandes volúmenes de datos para sus clientes en finanzas, servicios públicos y gobierno ;
- DataStax, que ofrece una versión comercial de la base de datos de código abierto Apache Cassandra NoSQL junto con los servicios de apoyo conexos incluidos con Hadoop.
Por supuesto, hay muchos otros que prometen Big Data creación de empresas que son demasiado temprano en su existencia a ser incluido en este informe los ingresos, pero que ninguno-la-menos están fuera de aperturas prometedoras. Entre ellos se encuentran Sqrrl, Aerospike, Platfora, Continuidad, Hadapt y Wibidata. Las empresas deben mantener una estrecha vigilancia sobre estos y otros datos de gran puros de papeles, ya que continúan desarrollando innovadoras pero prácticas Big Data plataformas, aplicaciones y servicios.
Línea de Acción: El mercado de Big Data está explotando, no sólo en términos de marketing publicitario, sino también en los ingresos reales. Mientras que las personas razonables pueden debatir definiciones y tamaños del mercado en general, una cosa está clara - Big Data es un mercado grande y de rápido crecimiento. Para profesionales de TI que significa la investigación de las formas en que se puede monetizar las fuentes de datos en sus organizaciones y la obtención de las habilidades necesarias para alcanzar dicho objetivo. Para la comunidad de proveedores que significa que usted necesita tener una historia alrededor de Big Data que es creíble con una hoja de ruta que ofrece un valor de negocio claro y flexibilidad para moverse con este espacio de rápido crecimiento.