¿Histogramas con la hoja de cálculo?

¿Se puede obtener un histograma usando Calc o Excel? Sí,  si todos los intervalos son de la misma anchura. En ese caso, es casi tan sencillo como dibujar un gráfico de columnas simple. Si ya hemos obtenido una tabla de frecuencias, y hemos dibujado un gráfico de columnas, como en este ejemplo

Calc   El método para convertir esto en un histograma es eliminar los espacios entre las columnas. Para ello:

  1. hacemos doble click en el gráfico para pasar a modo Edición (notaremos que el gráfico aparece realzado).
  2. pinchamos una vez en una de las columnas para hacer aparecer estos puntos verdes
  3. Hacemos click con el botón derecho del ratón en uno de los rectángulos para que aparezca un menú, en el que seleccionamos «Formato de serie de datos«
  4. En la pestaña Opciones, buscamos Espacio, lo fijamos en el 0%, y pulsamos Aceptar. Con esto, las columnas del gráfico aparecerán pegadas entre sí:

Con los pasos anteriores, y recordando siempre que los intervalos deben ser todos de la misma anchura,  tenemos algo muy parecido a un histograma (hay detalles mejorables, relativos por ejemplo al etiquetado de las columnas, pero eso puede arreglarse a mano).

Aquí tienes el fichero que hemos usado en este ejemplo, y en este otro enlace el fichero con el gráfico final.

Excel 2010

El procedimiento es prácticamente el mismo, pero a la hora de crear el gráfico de columnas seleccionamos sólo la columna de frecuencias. En el menú Insertar de Excel elegimos el gráfico de columnas. Cuando el gráfico aparece hacemos doble clic, y aparece este cuadro de diálogo
y ponemos el ancho del intervalo a 0. Con eso el gráfico ya tiene el aspecto deseado. Si queremos que los extremos de los intervalos aparezcan en el eje horizontal hacemos click con el botón derecho en el gráfico y elegimos Seleccionar datos… en la ventana que se abre

podemos usar la parte derecha (pulsar en Editar) para añadir la columna de extremos de intervalos como etiquetas del eje horizontal. Después pulsamos Aceptar, y ya tenemos nuestro gráfico listo.

Aquí tienes el fichero Excel con los datos y la tabla de frecuencia ara que practiques, y aquí el fichero con el gráfico incorporado.

Gracias por la atención.

Ficheros csv con las hojas de cálculo

(Revisado el 2013-06-25)

Un fichero csv (comma separated values) es, como su nombra en inglés indica, un fichero con un tabla de datos, agrupados en campos (o variables), de manera que:

  • cada fila de la tabla de datos se corresponde con una línea del fichero, y
  • cada uno de los valores de los campos en esa fila está separado de los demás por comas (o algún otro símbolo preestablecido).

Vamos a intentar aclarar todo esto con un ejemplo. Imagínate que tienes una agenda donde están almacenados los nombres de los empleados de una empresa, la fecha de su cumpleaños, y su antigüedad en años en la empresa. Podrías tener una tabla como esta:

Esa tabla se almacenaría en un fichero csv con seis filas, como este (la primera es la fila de títulos, con los nombres de los campos o variables):

Nombre, cumpleaños, antigüedad
Gema,17-03, 8
Luis,12-07, 5
Marcos, 4-09, 2
Elena, 8-04, 3
Daniel, 6-11, 3

Vamos a llamar empleados.csv a ese fichero (puedes usar el enlace para descargarlo). La mayor virtud (y a la vez la mayor limitación) de los ficheros csv es su sencillez. Un csv no contiene nada más que los datos, sin añadir ninguna información, formato o cualquier otrta característica específica de un determinado software. Por lo tanto el fichero csv es un candidato  natural a convertirse en el típico fichero de intercambio que se utiliza para mover los datos desde la hoja de cálculo a otro programa (como R, por ejemplo, si vamos a hacer análisis estadísticos de estos datos).

El principal patrimonio de un fichero csv, por tanto, es su carencia de formatos, y para aprovecharlo debemos tener cuidado de manipularlo con programas que no le añadan formatos que echarían a perder sus propiedades. Por esa razón muchas veces manipulamos los ficheros csv con editores de texto, en lugar de usar procesadores de texto o algún otro tipo de software. Si no conoces la diferencia entre editores y procesadores de texto, simplificando mucho podemos decir que un procesador de texto es una aplicación como Microsoft Word o como OpenOffice Writer , que permiten crear documentos con mucha estructura y formato (negritas, cursiva, subrayados, inclusión de imágenes, distintos tamaños de letra y tipografías distintas, etc.).  Por el contrario un editor de texto trabaja sobre lo que llamaremos «texto plano», sin formatos de esa clase.

Windows incluye en todas sus versiones un editor de texto muy sencillo, el Bloc de Notas, que voy a usar para ilustrar esta entrada. En Mac creo que se puede usar TextEdit, pero hay que seleccionar la pestaña Formato y y elegir Convertir en texto normal; pero tened en cuenta que yo no uso Mac, así que tal vez haya soluciones mejores. SI eres usuario de Linux, seguramente ya estás (más que) familiarizado con algún editor de texto plano.
Abrimos el fichero empleados.csv  con el Bloc de Notas de Windows, y veremos algo como esto:

Como puedes ver, el fichero contiene los datos de la tabla y nada más que los datos de la tabla.

Las hojas de cálculo pueden abrir estos ficheros csv. La palabra correcta, más que abrir, es Importar porque la hoja de cálculo traduce el fichero csv a su propio formato al abrirlo. Este mecanismo de traducción es más o menos automático (o explícito) dependiendo de la hoja de cálculo que usemos, así que vamos a ver cómo funciona en Calc y en Excel.

Importando un fichero csv  en Calc

Si le pedimos a Calc (en Open Office o Libre Office) que abra el fichero, nos encontraremos con un cuadro de diálogo como este

Lo primero en lo que hay que fijarse es que Calc no ha entendido cómo se separan los datos, de modo que cada fila del fichero ocupa una única celda de Calc. Pero el remedio es sencillo: en ese cuadro de diálogo podemos marcar las casillas que le indican a Calc cuál es el símbolo que se utiliza para separar los datos. Muchas veces seran comas, pero en ocasiones nos encontraremos con ficheros en lo que se han usado otros símbolos, espacios, tabuladores, etc. Nosotros, en este ejemplo, marcamos la casilla coma, y obtenemos esto

Ya casi está listo. Te habrás fijado en que hay caracteres extraños en la primera fila, la que contiene los nombres de las variables. A veces hay que jugar un poco con el Conjunto de caracteres que aparece en este cuadro de diálogo. Para nosotros, normalmente el ajuste Europa occidental, o el UTF-8 deberían funcionar. Y en ejemplos como este, donde eso no afecta a demasiadas celdas, siempre lo podemos corregir a mano después.

Cuando estamos satisfechos pulsamos Aceptar y ya está:

tenemos los datos en Calc. Cuando hayamos hecho operaciones con ellos llegará el momento de guardarlos. Por ejemplo, podemos calcular la antigüedad media de los empleados. SI hacemos esto, y después tratamos de guardar el fichero, Calc detecta que el fichero incorpora modificaciones, que no sabe como guardar en un fichero csv y nos  presenta esta advertencia:
Si aquí elegimos seguir usando el formato csv seguramente perderemos todo el trabajo que hayamos hecho en Calc con los datos (cálculos estadísticos, gráficos, etc.). Para evitar eso, elegiríamo el formato ODF propio de Calc, y guardaríamos el trabajo en un fichero distinto del csv original (por ejemplo este fichero empleados.ods en el que hemos añadido el cálculo de la antigüedad media y un gráfico).

Importando un fichero csv  en Excel

Con Excel 2010 las cosas son parecidas, pero un poco más complicadas. Si le pedimos a Excel que abra el fichero directamente, lo hará sin preguntarnos nada, pero como puede verse, el resultado no será el esperado

Para conseguir lo que queremos, abrimos Excel 2010, y en el menú Archivo elegimos la opción Desde texto

A continuación se abre un cuadro de diálogo en el que localizamos el archivo, y en el que debemos pulsar sobre la opción Importar. Esto hace que Excel abra un asistente de importación que nos irá guiando a través de varios diálogos, con opciones similares a las que hemos visto para Calc.

Gracias por la atención.

Tablas de frecuencias en hojas de cálculo (Calc y Excel)

Cuando se empieza el estudio de la Estadística, es importante conocer las posibilidades que ofrecen las las hojas de cálculo.Hay muchas operaciones elementales (y no tan elementales) con conjuntos de datos que se realizan fácilmente usando esos programas.

En esta entrada quiero explicar cómo utilizar la función FRECUENCIA de  una hoja de cálculo (en concreto las últimas versiones de Calc, o Excel 2010), para obtener las tablas de frecuencias de un conjunto de datos. Esta es una operación básica que realizamos muchas veces al comenzar el análisis de un conjunto de datos, y el uso de esa herramienta (en especial en Excel 2010) no es del todo intuitivo. Para ilustrarlo he preparado un videotutorial que espero que sirva de ayuda (ver a pantalla completa). Se explica en detalle el caso de Excel, porque en Calc las operaciones son las mismas, hasta el último paso, que en Calc no es necesario. Si eres más aficionado a leer que a ver vídeos, aquí tienes una explicación en pdf de lo mismo que se cuenta en el vídeo.

Y aquí tenéis la FuncionFrecuencia-Excel2010 resultante de ese ejemplo.