Accions

teixidora

Lab/Bots/Importar desde etherpads

De teixidora

< teixidora:Lab‎ | Bots

Importar desde etherpads[ ]

Descripción inicial a partir de la cual se desarrolló el Bot importador en 2017

Nuevas fases de desarrollo: 1 · 2 · 3


Sistema de importación de contenidos desde etherpads a Teixidora.

Tarea definida aquí: http://redmine.wikis.cc/issues/111

Contexto de partida[ ]

  • Usamos pads para tomar notas colectivamente entre los participantes de los eventos ( ver)
    • En los pads usamos secciones (headlines) o bien etiquetas (com # u otro signo) para ordenar o marcar contenidos estructurados que irán a parámetros concretos de la plantilla en SMW
    • Hay conjuntos de líneas que iniciamos por asterisco * porqué luego hay campos que lo convierten en valores múltiples de una propiedad (ver los de Procomuns 2017 como este pad y la copia de sus contenidos en esta página)
  • Durante el evento el pad está enlazado en su página en Teixidora
  • Pasados unos días después del evento copiamos el contenido del pad en una subpágina del wiki (por ejemplo la página Coinnova16,_taula_d'educació_i_treball_2016/11/30 tiene apuntes copiados en Coinnova16,_taula_d'educació_i_treball_2016/11/30/apunts).t
    • Para conservar los formatos y estilos de texto copiamos los contenidos del pad en una subpágina de nuestro usuario en Wikipedia (!) con el Editor Visual, guardamos, luego editamos con código y copiamos el contenido generado en formato wikitext. Si hay links tenemos que hacer buscar y cambiar para eliminar la etiqueta "nowiki" que el Editor Visual pone.
    • La plantilla "Esdeveniment pr" para páginas de acontecimientos en Teixidora tiene previsto un enlace en rojo que abre la subpágina de apuntes dónde pegamos el contenido copiado y lo salvamos. La plantilla muestra incrustada esta página en la del evento.
      • Una cuestión no resuelta es que algunos eventos tienen más de un pad de apuntes y sólo está prevista una página para copiarlos (ver esta página por ejemplo).
    • Después del evento (normalmente, aunque en algunos casos puede hacerse durante) se hace un vaciado de contenidos para rellentar diversos campos del formulario en Teixidora que permiten las conexiones semánticas.
      • Se extraen de los contenidos las palabras clave
      • Se extraen las personas, organizaciones, proyectos y publicaciones mencionadas
      • Se extraen contenidos estructurados (ahora Debilidades, Oportunidades y Propuestas; próximamente también Critérios, Conclusiones, Aprendizajes, Acuerdos, Preguntas)
    • También se pasa al wiki información de la toma de apuntes. Actualmente hay un campo multivalor para los nicks de los note-takers identificados y otro numérico para el número de note-takers anónimos.
  • Todas estas tareas (copia y vaciado de contenidos) son tediosas y repetitivas para una persona humana hacen poco dinámico el uso de Teixidora.
  • Después del vaciado de contenidos algunos enlaces en la página son rojos, porque refieren a páginas que no existen. Un valor de Teixidora es que los eventos sirven para cartografiar actores vinculados. En algunos casos hacemos acciones para azulizar enlaces rojos. Esta es una tarea difícilmente automatizable. (ver teixidora:Buidarada_SobTec17)

Requisitos del sistema[ ]

Usamos el método MoSCoW para priorizar las funcionalidades que debería tener.

Must have / Tiene que tener[ ]

Máxima prioridad.

Copia de contenidos de un etherpad al wiki y estructuración básica de contenidos.

  • Activar cuando en la página del wiki se valide una checkbox
  • Busca el pad o pads enlazados en el parámetro "notes pad url" de la plantilla en el wiki
  • Toma el contenido del pad
  • Lo pasa a formato wikitext
  • Lo copia y guarda en una subpágina del wiki
  • Parsea el contenido buscando etiquetas
  • Toma contenido etiquetado
  • Incorpora contenido etiquetado en los campos correspondientes de la plantilla en el wiki
  • Desactiva la checkbox para que no vuelva a repetirse la acción
  • Deja información de la acción realizada en una página de log en el wiki (que administradores o usuarios pueden marcar para seguir)
  • Pone la página editada en una categoría
  • Deja mensajes en el resumen de edición de las páginas que edita

Consideraciones:

  • Granja de etherpads prioritaria pad.lamardebits.org
  • Hay que definir como serán las etiquetas en el pad.
    • Opción A (preferible): los contenidos que irán en un campo están dentro de una sección o subtítulo. Por ejemplo ==Oportunitats==
    • Opción B: una etiqueta de inicio y otra de cierre. Del tipo #Oportunitats-on #Oportunitats-off dentro de la cual está el contenido a extraer
  • Hay que definir el match entre etiqueta en el pad y nombre del campo en la plantilla del wiki. A qué etiqueta corresponde qué campo.
  • Si se usan etiquetas que no son de tipo "código" (opción B) habría que preveer que se borren del texto copiado en el wiki, una vez parseado y extraído.
  • Para convertir de etherpad a wikitext
  • Algunos campos del formulario en el wiki están en subplantillas, hay que estudiar si mantener esto y si es así tener en cuenta que el sistema tiene que añadirlas, por ejemplo "{{Esdeveniment pr/resultsWO}}".

Should have / Debería tener[ ]

Alta prioridad

  • Usar varias granjas de etherpad con distintas versiones del mismo.
  • Toma del pad los nombres de los "Authors" (está en el Timeslider) y los pone en el campo "note-takers" de la plantilla en el wiki
  • Toma del pad la cantidad de "unnamed authors" y lo pone en el campo "anonymous-note-takers" de la plantilla en el wiki
  • La correspondencia etiqueta del pad/campo de la plantilla en el wiki no es fija en el software, se puede definir y cambiar en el wiki
    • Hay una página (puede ser editable sólo para administradores o grupo de usuarios específico) en la que se definen las correspondencias, el sistema lo toma de allí para parsear y extraer
      • Algo tipo #Oportunitat > ||opportunity
  • Que aunque se vuelva a validar la checkbox no vuelva a hacer la acción puesto que sería destructiva de lo que se siga trabajando en el wiki.
    • Podríamos buscar la forma de ocultar la checkbox en el formulario (quizás en base a otra checkbox :-)

Could have / Podría tener[ ]

Prioridad media.

  • Posibilidad de usar pads distintos a etherpad
  • Posibilidad que se pueda repetir la acción para el mismo pad y la misma página siempre que no haya habido una edición humana de la misma (porque una vez hecha la acción automatizada prevalecen las correcciones humanas realizadas sobre el wiki y no sobre el pad).

Won't have (this time) / No tendrá (ahora)[ ]

Prioridad baja.

  • Ir archivando los pads, además de en el wiki, en un repositorio de github (pendiente valorar)