Aunque el tamaño para determinar si un conjunto de datos se considera Big Data no está definido "formalmente", la mayor parte de los expertos se refieren a conjuntos de datos que van desde 30-50 Terabytes a varios Petabytes.
- La complejidad del Big Data se debe principalmente a la naturaleza no estructurada de gran parte de los datos generados por las tecnologías modernas, como los web logs, los dispositivos RFID, los sensores incorporados en smartphones, las búsquedas en Internet, las interacciones en redes sociales o los registros de centros de llamadas.
- En la mayoría de los casos, con el fin de utilizar eficazmente el Big Data, debe combinarse con datos estructurados (normalmente de una base de datos relacional) de una aplicación comercial más convencional, como un ERP (Enterprise Resource Planning) o un CRM (Customer Relationship Management).
- Lo que hace que Big Data sea tan útil para muchas empresas es el hecho de que proporciona respuestas a muchas preguntas que las empresas ni siquiera sabían que tenían. En otras palabras, proporciona un punto de referencia.
- Como mencionamos antes, el Big Data se puede definir a través de sus cinco características principales, conocidas también como las cinco "V" del Big Data (volumen, variedad, velocidad, veracidad y valor). A éstas, se les pueden añadir dos más: viabilidad y visualización.