ForoCategoría: Preguntas Frecuentes RetoSiginficado de los datos
singleton ha preguntado hace 1 año

Buenas tardes,
Escribo para hacer unas cuantas preguntas sobre los datos, ya que tras leer el apartado de Explicación de datos hay algunas cosas que no me han quedado claras.

  1. Dónde están los datos de los nidos que se retiraron en años pasados? Intuyo que están en el archivo de https://www.opendatabizkaia.eus/es/catalogo/avispa-asiatica/recurso/datos-nidos-avispa-asiatica. Según lo que he entendido habría que agrupar este conjunto de datos por municipio y año, y eso nos daría el numero de nidos que se retiraron en años pasados en cada municipio. Es esto correcto?
  2. Por otro lado, en el dataset anterior veo que solo hay datos para 2017, 2018 y 2019. Sin embargo, en la descripción del reto se especifica que hay datos del 2016 al 2019. Lo he entendido bien?
  3. Además, para este mismo dataset no se dan explicaciones de lo que significa cada columna, y eso es un poco confuso. Por ejemplo, en la columna ESTADO_CAS vemos los siguientes resultados: [ CERRADA – ELIMINADO’, ‘CERRADA – NO ELIMINABLE’, ‘PENDIENTE DE GRUPO’. Qué significado tiene esto? Hay que contar cómo retiradas todas ellas o tan solo las CERRADA-ELIMINADO? 

Muchas gracias por la ayuda!

8 respuestas
Javier Cañego (Kopuru) ha respondido hace 1 año

Hola Singleton, lo primero agradecerte tu interés en el reto.
Lo primero, aclarar que desde Kopuru no tenemos ningún poder sobre los datos de Open Data Bizkaia. En los dataset en los que os remitimos directamente a la web de opendata de los que descargar datos no hemos participado en la recogida ni tratamiento de los mismos. (Ej Mapa forestal CAE, Nidos Bizkaia)
Te contesto a las preguntas por puntos:

  1. Efectivamente hay que agruparlos por municipio y año para conocer los nidos por municipios anualmente.
  2. Para los nidos retirados hay datos para 2017, 2018 y 2019. Hay algunos datos que si tienen valores de 2016 como pueden ser las estaciones meteorológicas.
  3. Desde Kopuru no tenemos conocimiento del significado de las diferentes columnas del dataset, tenemos la información que se puede observar en el enlace. En el desconocimiento de estas variables y qué hacer con ellos entra el criterio de cada científico de datos para ver el tratamiento que hacer con estos datos, por lo que no podría darte una respuesta correcta.

Un saludo y muchas gracias por la participación.
Suerte!

singleton ha respondido hace 1 año

Muchas gracias Javier por tu respuesta. 
Tengo una duda más:
Me comentas que “Desde Kopuru no tenemos conocimiento del significado de las diferentes columnas del dataset”, sin embargo, para realizar el cálculo de las métricas de evaluación necesitáis haber dado un significado a estas columnas. Es decir, para saber el numero de nidos retirados en 2020 -el dataset de evaluación- se tiene que agrupar por municipio y por año el dataset de opendatabizkaia, pero en este dataset hay mezclados tipos de nidos – en concreto: [‘AVISPA ASIÁTICA’, ‘AVISPA COMÚN’, ‘ABEJA’, nan]. Me imagino que os habéis quedado tan solo con los de AVISPA ASIATICA. En este caso parece evidente el significado de la columna y como usarla para filtrar. Sin embargo, me pregunto si ocurre algo parecido con otras columnas, como podría ser el caso de la columna EGOERA_CAS/ESTADO_CAS.
Me preocupa ya que si para evaluar se tendrán en cuenta unos casos en concreto, es importante conocer estos casos para generar el modelo de predicción. Esto es, que el model se entrene y se evalue con datos provenientes de la misma distribución.
Espero no causar mucha molestia y muchas gracias por la ayuda!

Javier Cañego (Kopuru) ha respondido hace 1 año

Hola singleton, molestia ninguna, de hecho, muy buena observación.
 
Desde Kopuru el trabajo que se ha hecho con los datos es, filtrar por especie (avispa asiática) y contar por municipios.
Como al igual que vosotros, no tenemos información sobre la descripción de cada una de las variables no hemos entrado a valorarla.
 
Muchas gracias por tu pregunta, estoy seguro que le va a servir a el resto de participantes!
 

bubyblede ha respondido hace 6 meses
[url=https://bestadalafil.com/]cialis 5mg online[/url] Cialis Tablets 10mg Heinz bodies attach to RBC membranes reducing their flexibility and making them prone to sequestration by the spleen. Weyeue Cialis Efpknv Miglitol Layyon https://bestadalafil.com/ – Cialis The Mind Think of the brain as the hardware that gives rise to the software which is the minda software that in essence writes itself and adapts itself and is always changing.

RalphDof ha respondido hace 4 meses

cialis drug intera*ctions tadalafil 20mg best price