Usuario discusión:Dodo/PruebaBot

Contenido de la página no disponible en otros idiomas.
De Wikipedia, la enciclopedia libre

Me has reabierto la pasión por el tema de la actualidad. ¿Se puede hacer un bot que coja palabras clave de una lista (de una página de la wikipedia a tal efecto) y recorra esta página poniendo wikienlaces? Si fuera así, mi imagen de la página de actualidad sería la siguiente:

El mismo día[editar]

1. Bot que coge noticias de google como estas que enseñas, o similares
2. Bot que lo llena de wikienlaces a páginas relacionadas con temas de actualidad

Al día siguiente[editar]

3. wikipedistas (si los hay) que hacen un resumen diario, o una lista de noticias más relevantes del día (o añaden si google se ha dejado alguna de la que ellos tienen conocimiento)

Cualquier día[editar]

4. wikipedistas (si los hay) que revisan la página, y añaden a la lista de palabras clave las correspondientes a temas nuevos o que falten
5. wikipedistas (si los hay) que revisan la lista de palabras clave, y crean/mejoran/actualicen los artículos que lo necesiten

Pasado el mes[editar]

6. wikipedistas (si los hay) que hagan un resumen de lo acontecido ese mes?

Así, logramos:

  • tener todas las noticias relevantes, todos los días (por 1 y 3)
  • tener todas las noticias enlazadas a sus artículos correspondientes (por 2 y 4)
  • tener buenos artículos sobre temas de actualidad (por 5), al liberar a los wikipedistas interesados en el tema de la tarea mecánica de recoger noticias
  • tener resúmenes hechos y revisados por humanos sobre las noticias más importantes (por 3 y 6)

En este formato, yo recomendaría una página por día, ya que se va a llenar de información libre, bien estructurada y bien enlazada (y todo ello se hace de forma automática, luego es inmune a subidas y bajadas de mareas de actividad). Las épocas buenas, tendrán, además, muchos artículos nuevos (y actualizados) sobre temas de actualidad. Las malas, pondremos un mensaje de "Este artículo trata de un tema de actualidad, y es posible que la información no esté totalmente actualizada", pero estaremos mejor que ahora...

¿Qué os parece?

4lex


No termino de captar qué significa eso de recorrer una lista de palabras claves... ¿Podrías poner un ejemplo?

Por otra parte, en principio soy contrario a que el bot rellene automáticamente la página de actualidad. Esto provocaría dos graves problemas:

  • Una avalancha de noticias intrascendentes. Por muy importante que sean para algunos las declaraciones del entrenador de turno, a la Wikipedia le deben importar tres cominos.
  • Una rebaja de la calidad de la sección de actualidad. Ya ves la cantidad de "errores" (mayúsculas mezcladas con minúsculas, fechas en los titulares, nombres de los periodistas/agencias que elaboran las noticias, etcétera) que se le "cuelan" a http://news.google.es. No creo que sea deseable que esto aparezca en la sección de actualidad.

Mi visión de la tarea del bot, repito, es la siguiente: que cada x horas vaya refrescando las noticias de actualidad en su propia página, y que archive en otras las antiguas, sin borrar nunca nada. La idea es tener una "hemeroteca" (las comillas es porque no tendremos texto sino más bien enlaces) de la que tirar para documentarse al escribir un artículo, o rellenar la página de actualidad.

¿Qué os parece? --Dodo 10:47 1 ago, 2004 (CEST)

En la lista de artículos relacionados con temas de actualidad hay una colección de tales palabras clave, pero habría que alargarla, desde luego. Mi idea era que un bot leyera una lista de palabras clave de ese estilo, y rellenara de enlaces la página de la hemeroteca, cada vez que apareciera esa cadena de texto.
Aunque a mí me gustaba la página de actualidad, en realidad pienso que debe ser un apoyo a otros artículos, para potenciar que se creen artículos sobre asuntos en los que se está escribiendo la historia, y para ayudar a mantenerlos actualizados. El que recojamos una avalancha de noticias intrascendentes (o más bien poco trascendentes, pensemos que dentro de unos años el tamaño de la wikipedia puede hacer que asuntos que hoy nos parecen triviales se incluyan como artículos) me parece un problema menor.
Pensándolo bien, tu visión del bot no difiere tanto de la mía, creo. ¿Y si la hemeroteca no la guardara el bot en su propia página, sino en una Wikipedia/Hemeroteca, con secciones como Wikipedia/Hemeroteca/1 de agosto? Aún en ese caso, me parecería muy útil que las palabras clave estuvieran señaladas. Así, a la hora de completar/actualizar el artículo Atentados de Madrid o Exploración de Marte, se podrá tirar de "lo que enlaza aquí" y consultar las páginas de la hemeroteca relevantes.
Si se hace de esta forma, se mantiene la idea de los resúmenes diarios/mensuales, que sería lo que se quedaría en la página de actualidad. La mayor pega es que podemos sufrir parones indefinidos de actividad en la actualidad, como ya ha ocurrido en un par de ocasiones.
4lex 11:58 1 ago, 2004 (CEST)
Hombre, la idea de la lista de palabras clave no es mala, pero me parece muy insuficiente. Y si tiramos de la lista de artículos relacionados con historia reciente, ya da un poco de vergüenza ajena. (¿La guerra civil española es un conflicto armado reciente? Ja.)
Por otra parte, no creo que sea buena idea enlazar a lo bestia con artículos generales. Me parece lógico que los artículos sobre España no enlacen a España sino a la Actual legislatura en España, porque así no aparecerán las páginas del bot al ver "lo que enlaza aquí" en la primera. Pero pensemos qué ocurrirá dentro de unos años: las noticias del bot de la anterior legislatura (ésta) enlazarán a la página de la actual (la próxima). Un cacao, vamos.
Hay que darle una pensada a lo de los enlaces... --Dodo 22:45 1 ago, 2004 (CEST)

Por otra parte, ya he registrado un Usuario:Google para el bot. ¿Cómo se le indica a la Wikipedia que dicho usuario es un bot? En la inglesa, existe en:Wikipedia:Bots. ¿Y aquí? --Dodo 22:45 1 ago, 2004 (CEST)


Ya he dicho en el café que Wikipedia no es de papel. Podemos permitirnos el lujo de tener una hemeroteca que crezca a razón de 10 kb cada día o más. No veo bien que el bot grabe las noticias automáticamente a Actualidad, ésa es una tarea que debe corresponder a los wikipedistas que sepan discriminar las noticias relevantes de las que no lo son. Nos dan igual las declaraciones de un entrenador, pero es relevante (o al menos lo será en un futuro) qué equipo gana tal o cual torneo. A lo mejor ahora no tenemos tiempo ni perspectiva de redactar un artículo en condiciones sobre la comisión de investigación del 11-M (o incluso del 11-S), pero si grabamos las noticias ahora nos será mucho más fácil retomar dicho artículo dentro de, digamos, un año. Sugiero que las páginas se llamen Wikipedia:Hemeroteca:1 de agosto de 2004, es decir, que indiquen día, mes y año.
Además, copiar las noticias de forma manual supondrá, espero, que nos fijemos en lo que copiamos y corrijamos lo que hay que corregir. No queremos un artículo de Actualidad de 30 Mb que hable sobre el último atraco a una jubilada en Villaconejos de la Sierra o las temperaturas anormalmente altas o bajas que sacuden dicho pueblo. Aunque a lo mejor eso también se puede conseguir si el bot lo graba automáticamente y el wikipedista de turno va borrando lo no relevante (que aun así se quedaría en la hemeroteca).
También espero que los artículos enlacen a Actual legislatura en España en lugar a España. Posteriormente podremos tirar de "lo que enlaza aquí" para mejorar los artículos correspondientes a "la actual legislatura en X país". El problema es cuando acabe la legislatura actual. En ese caso, creo que un bot debería cambiar automáticamente todos los enlaces de Actual legislatura en España a Legislatura 2004-2008 de España o similar. Sabbut 23:14 1 ago, 2004 (CEST)