datos definición y clasificaciones
Conexiones neuronales.

Datos: Definición y Clasificación

Los datos pueden presentarse de muchas maneras diferentes, pero al tener una naturaleza muy diversa se pueden clasificar de acuerdo con diferentes criterios, en este artículo explicaremos en que consisten los datos y los clasificaremos según su estructura:

Definición

Un dato es el valor simbólico (numérico, alfabético, algorítmico, etcétera.) que se da a una entidad. Dentro de un posible rango de valores. Se estructuran de la siguiente manera:

Datos Simples

Letras, números enteros o una secuencia de coordenadas. En definitiva, son datos indivisibles con un significado propio.

Datos Compuestos (Estructurados)

Hay ocasiones en las que los datos se agrupan en estructuras más complejas conforme su dimensionalidad. Es obvio que un dato individual no tiene dimensiones, pero sin embargo una secuencia o una estructura de datos ocupa filas y registros organizados en registros y campos, convirtiéndose en tablas o matrices.

Hay muchos tipos de datos que se manipulan como si fueran simples pero en realidad se trata de datos compuestos con una estructura bien conocida. Por ejemplo:

  • Imágenes: Se trata de una matriz de dos dimensiones (alto x ancho) donde cada elemento se define por colores RGB.
  • Publicaciones: Consiste en un texto que incluye datos como el título o la fecha de publicación.
  • Tweets: Consiste en una estructura con un máximo de 280 caracteres, en el tweet se incluye información de la geolocalización, fecha en la que se escribió el mensaje y referencias a otros tweets.

Metadatos

Los metadatos se utilizan cuando los datos necesitan ser descritos por otros datos. Por ejemplo:

  • Fotos: A parte de la imagen reproducida, se incluye información como la resolución, profundidad de color, lugar de la fotografía, etcétera.
  • Redes Sociales: Se generan datos a partir de la interacción entre los usuarios, generando estructuras y grafos con la información generada.

Datos semiestructurados o no estructurados

Los datos semiestructurados consiste en documentos que no tienen una estructura prefijada. Otro ejemplo sería el lenguaje de programación HTML, que a pesar de un lenguaje estructurado resulta funcional sin obligatoriamente respetar la sintaxis.

Es importante destacar que los datos estructurados suelen estar generados por computadoras, mientras que los no estructurados están generados por humanos.