Descargar datos:
El dataset para entrenar los datos: dataset_train_diabetes
El dataset para hacer las predicciones finales (de aquí se saca el resultado del desafío): dataset_test_diabetes
Ninguna de las variables tiene falta de datos.
En total son 8 variables, 9 con la clase.
Variable | Tipo | Información |
class | nominal | 1= “positivo”
2= “negativo” Hay 2 valores diferentes. |
preg | numérico | Número de veces que ha estado embarazada.
Hay 17 valores diferentes. |
plas | numérico | La concentración de glucosa plasmática a las 2 horas en una prueba de tolerancia oral a la glucosa.
Hay 136 valores distintos. |
pres | numérico | La presión diastólica en sangre (mm Hg). (presión entre latidos cuando el corazón se está llenando de sangre)
Hay 47 valores distintos. |
skin | numérico | Grosor del pliegue cutáneo del tríceps (mm).
Hay 51 valores distintos. |
insu | numérico | Insulina sérica de 2 horas (mu U/ml). (Esta prueba mide cuánta insulina hay en la sangre).
Hay 186 valores diferentes. |
mass | numérico | Índice de masa corporal (peso en kg/(altura en m)^2).
Hay 248 valores diferentes. |
pedi | numérico | Función de pedigree de diabetes. (Función que califica la probabilidad de diabetes según los antecedentes familiares).
Hay 517 valores diferentes. |
age | numérico | Edad en años.
Hay 52 valores distintos. |
Breve análisis estadístico
Variable | Media | Desviación estándar |
preg | 3.8 | 3.4 |
plas | 120.9 | 32.0 |
pres | 69.1 | 19.4 |
skin | 20.5 | 16.0 |
insu | 79.8 | 115.2 |
mass | 32.0 | 7.9 |
pedi | 0.5 | 0.3 |
age | 33.2 | 11.8 |
El objetivo es sencillo: construye un modelo predictivo que indique quién tiene probabilidad de tener diabetes, utilizando los datos de dataset.
- Analiza bien la información
- Genera un modelo predictivo y entrénalo
- Obtén resultados y evalúalos
La solución se evaluará en base al porcentaje de exactitud del modelo frente a la realidad.
Descripción general de cómo funcionan las competiciones de Kopuru
- Únete al reto
Lee la descripción del desafío, acepta las reglas de la competición y accede al conjunto de datos del Reto. - Manos a la obra
Descarga los datos y genera un archivo de predicción. - Hacer una presentación
Carga tu predicción como una presentación en Kopuru y recibe una puntuación de precisión. - Consulta la tabla de clasificación
Mira cómo se clasifica tu modelo frente a otros competidores en nuestra tabla de clasificación
La tasa está en torno al %82.
Descargar las etiquetas del dataset test: Soluciones test