Salarios en Argentina

El otro día mientras leía unos twits sobre salarios me agarró curiosidad sobre cuánto se cobra en Argentina. Naturalmente, como no todos cobran lo mismo, y como hay muchos asalariados como para ver caso por caso, esa curiosidad se hizo más bien hacia la distribución de los ingresos. Me baje entonces una encuesta del indec que, entre otras cosas, registra los ingresos de los encuestados. La verdad que me pareció raro (y no sólo a mi) porque tenía una distribución con parámetros todos muy bajos (el máximo, la media, etc.).

En otro twit alguien había respondido con una encuesta que había hecho que se encuentra acá. Corresponde a febrero de 2018 (de manera que muy probablemente de responder hoy los encuestados darían otro números) y en la página se dan más datos. Pero como era una tabla con muchas menos columnas, me pareció razonable empezar por ahí.

Lo que hice fue entonces bajar esa tabla. Modifiqué algunos detalles, porque había unos sueldos declarados por debajo de los 150 pesos y me pareció tan poco que supuse que los habían reportado en unidades de mil. Los multipliqué por mil entonces (téngase en cuenta que tanto la media como la varianza de este subconjunto de datos -ya multiplicados- era menor a la otra parte, por lo que me pareció más razonable).

Una vez hecho esto, como había alguno que declaraban el salario bruto y otros el neto, corregí los brutos multiplicándolos por un factor de .83, que si no entendí mal, era lo que hacía una página que googlié para calcular el neto en base al bruto.

Después descarté los que declaraban part time, porque probablemente cobren menos y eso metería un ruido.

Finalmente saqué algunos valores un poco altos que podrían considerarse “outliers”. ¿Cómo decidí que eran muy altos? Bueno consideré aquellos que estaban arriba de unos cuantos desvíos estándar arriba de la media (esto no tiene más fundamento, que el de que la visualización de los datos no esté demasiado influída por unos muy poco valores, o sea creo que ninguno). Ojo que la distribución de sueldos no es normal. Me pareció mejor descartar esos valores, que correspondían a menos de un 0.6% ( o sea bastante poco) y que hacían más confuso el gráfico. Dos comentarios al respecto. Primero, que el método para detectar outliers no es el que yo usé, sino que es otro que marca los que se alejan creo que una vez y media la distancia intercuartil de primer y tercer cuartil. No use ese método porque terminaba excluyendo sueldos bastante verosímiles desde 83 mil. (Update: también pongo el gráfico sin outliers, pero desconozco si los economistas tienen algún criterio común con respecto a este punto). Segundo comentario, no se excluyen valores por abajo (ni siquiera alguno que parecen demasiado bajos) porque tampoco quedan afuera con el criterio de la distancia intercuartil.

La siguiente tabla resume la encuesta:

Min. 1st Qu. Median Mean 3rd Qu. Max.
2324 26000 35690 41224 48000 205010

Y el gráfico (la media está en azul y la mediana en verde)

salarios

(y esta sacando los outliers con el método común)

Min. 1st Qu. Median Mean 3rd Qu. Max.
2324 25000 35000 36604 45000 80178

salarios-sin-outliers

Respecto del tema de los outliers, dejo lugar a los que saben interpretar “datos estadísticos” que acoten en los comentarios.

Respecto a los datos de la encuesta, bueno, la verdad que a esta altura desconozco si puede ser de alguna utilidad porque al no saber cómo se hizo, ni siquiera puedo tratar de estimar qué tanto se aleja de los datos reales. Supongo que debe ser un problema no demasiado infrecuente en las ciencias sociales

Y con respecto a los datos del indec, me quedé sin tiempo ahora de hacer gráficos, porque además es un poco mas engorroso, ya que las columnas tiene códigos que hay que buscar en una documentación en pdf. De todos formas, para hacer más fácil la búsqueda de datos del indec se me ocurrió hacer indek. Update: en esta entrada están los datos de la encuesta permanente de hogares del indec.

Anuncios

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión /  Cambiar )

Google photo

Estás comentando usando tu cuenta de Google. Cerrar sesión /  Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión /  Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión /  Cambiar )

Conectando a %s