Accions

teixidora

Lab/Bots/Corrector/Observacions

De teixidora

< teixidora:Lab‎ | Bots‎ | Corrector

Observacions de com funciona el Bot corrector[ ]

Viabilitat de millora:

  • [X]: Viable i se sap com fer ho
  • [X]: Hauria de ser viable però cal investigar
  • [X]: S'hauria d'investigar
  • [X]: Per ara no és possible

Categories de millores conegudes:

  • [1]: espai equivocat
  • [2]: lletres capgirades
  • [3]: traducció comuna
  • [4]: entity tagging in event page/notes
  • [5]: error tipogràfic comú
  • [sw] : stop word
  • [tm]: traducció manual

Pentinada correctora[ ]

Observacions en la "pentinada correctora" iniciada l'agost de 2020.

Errors d'escriptura[ ]

  • económias > economías > económicas / volía dir "económicas" però el bot ha entès que volia dir "economías" ref
  • ciudadnos > ciudad nos > ciudadanos / no interpreta bé que era "ciudadanos" mal escrit ref
  • etnadares > encadares > estándares ref
  • remunipalicaciòn > remunicipalización / se li ha passat, no ho ha corregit - remunicipalizar, municipalización, remunicipalización i també en català, són termes que surten, inclús poden ser paraules clau ref
  • Observo que no corregeix quan hi ha majúscules incorrectes en una paraula correcta. Per exemple "EStuvimos" ref

Errors ortogràfics[ ]

  • "mas" no es corregeix a "más" en textos en castellà ref
  • haciendolo > haciendo lo > haciéndolo / separa "lo" enlloc d'accentuar haciéndolo ref El mateix per "haciéndola"
  • alla > al la > allá / separa enlloc de posar l'accent ref
  • No corregeix publico > público perquè seria correcte, per exemple "yo publico un libro", per tant cal basar-se en parelles de mots per aquest cas, per exemple "sector público" ha d'anar amb accent, o "hacienda pública" o "políticas públicas". ref
  • DUBTE en / amb - El text: "el repte de poder seleccionar actors en relació als esdeveniments en els quals han participat." el bot el corregeix per: "el repte de poder seleccionar actors amb relació als esdeveniments en els quals han participat" - diríem que el correcte és "en" ref

Llengua, llengües barrejades, traduccions[ ]

Alguna terminologia d'altres llengües, especialment de l'anglès en textos en castellà, català, francès o italià, s'haurien de traduïr, altres s'haurien de mantenir però entre cometes.

  • [sw] commons goods > commons godos > mantenir en anglès
  • [sw] economía del gig > economía de bolos? > gig economy < prendre alguna decisió sobre com traduir millor
  • [sw] smartness > de martes > hauria de mantenir "smartness" en anglès, encara que el text sigui en castellà ref
  • prividers lock > privadero rock > bloqueos de proveedores ("providers lock") ref
  • [tm] commoners > componer > commoners (o "comuners" o "comuneros") o respectar l'anglès o traduïr-lo.
  • [tm] "unicorn" es refereix a les corporacions "unicorn" (que salten de cotització molt ràpidament), per tant en castellà caldria mantenir l'anglès o traduir (millor) a "unicornio". En la ref s'havia corregit a "único".
  • [sw] match-funding > match-fundan > matchfunding
  • [sw] queries > quèries millor mantenir en anglès, sense accent. ref
  • [sw] tags> tens millor mantenir en anglès, sense accent. ref
  • [sw] "little data" > tradueix com "litre data" tot i que està entre cometes, millor guardar l'anglès. ref
  • [sw] datathon > tradueix com a datàfon millor guardar l'anglès. ref

Abreviacions, plurals i similars[ ]

  • [tm] "bcn" caldria canviar-ho per Barcelona
  • [tm] "q" quasi sempre és "que" quan apareix sola entre espais
  • [tm] "pq" sol ser "perquè" en català i "porqué" en castellà - en un text s'ha corregit per "pH" ref
  • [tm] org > oro > org / "org" quasi sempre vol dir "organitzacions" o l'equivalent amb la llengua del text. També pot ser "organització" en singular, per saber-ho caldria mirar l'article (la, les, aquelles, algunes, alguna...). / en aquest text ref en castellà erròniament s'ha corregit per "oro".
  • [tm] "colab" sol ser "colaborativa" o "colaborativas"
  • [tm] "corp" i "corps" solen ser l'abreviació per a "corporacions" i "corporacions". Igual en castellà. En francès o anglès no s'hauria de considerar abreviació perquè podria ser una confusió amb "corp" o "corps" com a "cos". Atenció al cas de ref en castellà on "corp" s'havia traduït "cuerpo".
  • [sw] "dataset" ho canvia per "d'atacat" - hauria de mantenir-se com a "dataset". ref

Vocabulari, terminologia, expressions[ ]

  • [sw] telecom > teleros / "telecom" i també "telecos" s'hauria de mantenir, són expressions. ref
  • [sw] apuntaire > a puntaire / "apuntaire" és com diem a Teixidora la persona que pren apunts, s'hauria de mantenir en singular i plural.
  • [sw] mapejar, mapatge, mapeig,... són expressions utiltizades avui - el bot ho tradueix com "marejar" ref
  • [sw] replicar, replicable,... són expressions utiltizades avui - el bot ho tradueix com "reproduible" deixaríem "replicar" per claredat ref

Entitats nexe[ ]

  • Barcelona en comù > Barcelona en como > Barcelona en Comú / És una organització, hauria de poder-ho detectar.

Correccions estranyes[ ]

  • Edusi.es > Edusi.és / Confón l'identificador de domini .es amb el verb. Revisar possibles confusions amb altres identificadors. ref

1eres proves de correcció[ ]

Errors d'escriptura[ ]

  • [1] "feruna" > "farina" > "...volíem fer una web", s'havia quedat junt "fer una". És corregible per nom sense gramàtica? ref
  • [1] "d ela" > "de ela" > hauria d'haver corrgit "de la" (identificar que la "e" havia quedat a la següent paraula ref
  • [1] "accésa" > "accés" > "accés a" > no identifica que ha de separar la "a", ho veu com un error de la paraula "accés"
  • [1] "paíssense" > "paisans" > "país sense" / hauria d'identificar que són paraules enganxades, molt típic al prendre apunts
  • [2] "canvair" > - > "canviar" / no ha detectat l'error i no ho ha corregit, és un error típic d'escriptura d'apunts, capgirar dues lletres. És estrany que no hagi corregit "canvair" doncs no vol dir res i el corrector de Firefox ho identifica.
  • [1] "Canvaira BURNER_REPO" > "Canviarà" BURNER_REPO > "Canviar a BURNER_REPO" / Aquí havia d'adonar-se que "Canvair" era "Canviar" i que la "a" havia quedat enganxada. Difícil però veiem en el cas anterior que "canvair" pot ser un error habitual o, al menys, ho és en aquest apuntaire, doncs passa dins el mateix text.
  • [X] "empails" > "rampells" > "emails" o bé "correus electrònics" ref
  • [X] "Fer serir la interfície web" > "Fer seria la interfície web" > "Fer servir la interfície web" ref

Errors ortogràfics[ ]

  • [X] "que el capitalisme s'apropií" > "que el capitalisme ensapropií" > "que el capitalisme s'apropiï" / Crec que la opció correcta és "apropiï" perquè deu trencar diftong. ref

Llengua, llengües barrejades, traduccions[ ]

  • [X] Cas de text en castellà dins un text en català: "Por qué queremos una web anónima y replicavle" > "Por que quere mos una web anònima y aplicable" ref
  • [X] Altre cas similar "Lo considera el cambio más grande que ha hecho el capitalismo en las ultimas decadas." > "El considera el cambio mas grande que hi ha saxo el capitalisme en las últimes dècades." > "Lo considera el cambio más grande que ha hecho el capitalismo en las últimas décadas."
  • [X] "desechable" > "destacable" > "descartable" / cas d'un "castellanisme", ens hi podem trobar, idealment l'hauria d'identificar com a paraula castellana i traduir-la. L'ha entès com un error d'una paraula catalana i ha posat una altra paraula que no hi té a veure. Aquest cas surt dos cops en el mateix text. En canvi al mateix article ho ha fet, ha corregit "portes traseres" per "portes posteriors", per tant sembla que sí, que identifica la llengua per aquest cas i la tradueix, no ha buscat una paraula catalana similar. ref
  • [3] "tor browser" > "tor bronsar" > "Navegador Tor" / no ho hauria d'haver corregit o haver passat a dir "navegador"; pot entendre's també com un anglicisme a corregir o a mantenir. ref
  • [3] "Si tens una còpia local cifra-la" > "Si tens una còpia local Cifre-la." > "Si tens una còpia local xifra-la". Castellanisme, però no literal perquè posa el pronòm separat amb guió. No s'entén però com arriba a "Cifre-la" i ho canvia a majúscula. ref
  • [X] "ser tractat amb respecte i amb "carinyo"" > "ser tractat amb respecte i amb "reina"" > ser tractat amb respecte i amb "cariño" o bé "ser tractat amb respecte i amb "cura"" / identifica bé que "carinyo" és un castellanisme, tot i la "ny" però ho canvia per "reina" que suposo que treu d'algun lloc on identifica com referir-se algú a la seva parella (femenina). En aquest cas no té sentit la correcció. ref
  • [4] "Despertar del sueño tecnológico" > "Despertar del suau tecnològic" / És un títol de llibre, calia mantenir en castellà. Opcions: si està entre cometes no corregir o posar com a dubte de correcció (fer-ho sempre o només si és més d'una o dues paraules que estan entre cometes? o sigui, si podem deduir que és un títol). Si existeix com una expressió nexe (en aquest cas és el títol d'un llibre de les pàgines tipus "Ref") no modificar. Si està a dins la mateixa pàgina a "Publicacions=" no corregir. ref

Abreviacions, plurals i similars[ ]

  • [3] "id" > "íd" > "identitat" ref
  • [X] autor/es > autor/és - Ha identificat "es" com a verb "és" > no fer-ho quan ve després de "/" seria suficient? ref i també ref
  • [X] "pCs" > "pas" > "PCs" ref
  • [X] "1Oct" > "oct" / mantenir "1Oct" o bé "1 d'Octubre" o "l'1 d'Octubre". Potser "1 d'Octubre" podria ser un "projecte" o "fet" amb entitat a Teixidora ref
  • [4] "exif" > "èxit" > "EXIF" / caldria identificar que és un format ref
  • [5] "comprimir ab pèrdua" > "comprimir av pèrdua" > "comprimir ab pèrdua" / podem considerar abreviació o error d'escriptura però és habitual posar "ab" per "amb" al escriure ràpid; sembla que ho ha identificat com "av" de "audiovisual" potser, que de fet podria ser una altra abreviatura habitual. Com distingir-les? Només per la gramàtica. ref
  • [X] "Ok residències no" > "Oc residències no" > "D'acord residències no" o bé "Estic d'acord en dir no a les residències" / Segurament la intervinent es va expressar literalment dient "ok residències no" o bé l'apuntaire va sintetitzar "ok que residències no" o bé "d'acord que residències no" ref

Vocabulari, terminologia, expressions[ ]

  • [4] "zerodays" > "Herodes" > "Zero Days" https://en.wikipedia.org/wiki/Zero_Days / difícil però hauria d'identificar que és una expressió (fa referència a una pel·lícula per referir-se a un tipus de virus o atac informàtic) ref
  • [X] "redireccionador" > "redimensionador" > no ho havia de corregir, havia de deixar "redireccionador" o bé posar "reencaminador" ja que en el mateix text canvia "redirecciona" per "reencamina". ref
  • [X] "logs de 1 no ens porti a 2." > "los d'1 no ens porti a 2" / s'havia de mantenir. Hi ha dues coses: "logs" és un terme anglès però que no traduïm. I en canvi "de 1 a 2" sí que es pot canviar, entenc, per "d'1 a 2" ref
  • [4] " generar un hash" > " generar un has" / no s'havia de corregir. Terme d'argot informàtic que cal mantenir. ref
  • [4] "captchas" > "caputxes" / no s'havia de corregir. Terme d'argot informàtic que cal mantenir. ref
  • [X] "gent vulnerabilitzada" > "gent invulnerabilitzada" / ho havia de deixar, canvia el sentit de la frase. Sembla que "invulnerable" o "invulnerabilitzada" és més habitual que "vulnerable" i "vulnerabillitzada". Però "vulnerable" i "vulnerabilitzat/da" és un terme habitual dels moviments socials, les ciències socials, etc i cal no corregir-lo ref
  • [X] " fora del model "consultiu" cap a un model "apoderadors" (de donar el poder)" > " fora del model "consultiu" cap a un model "apodera dors" (de donar el poder)" > " fora del model "consultiu" cap a un model "apoderador" (de donar el poder)" / només calia corregir el plural al singular (per model). "apoderar" i "apoderador" es fa servir per influència de l'anglès, també es fa servir "empoderador" i "empoderar" que Termcat recomana https://www.termcat.cat/ca/cercaterm/fitxa/NDMwODU4OQ%3D%3D . ref
  • [3] "cohousing sènior" > "coguessin sènior," > "cohabitatge sènior" / s'havia de mantenir o canviar per "cohabitatge sènior", identificar l'expressió com a anglicisme i argot ref

Entitats nexe[ ]

  • [4] "blogspot" > "blogs pot" > "Blogspot" o "Blogspot de Google" s'hauria d'identificar com un "Projecte" i no modificar-se. ref
  • [X] comTor" > "Costur" > "com Tor"" / Aquí potser hauria d'haver identificat que "com" s'havia enganxat a una paraula que comença en majúscules i, per tant, és un nom propi. I potser identificar "Tor" com a projecte. En el mateix text surt "Tor" mencionat més vegades i no l'ha corregit. ref
  • [X] "Trails" > "Traïts" > "Tails" / error difícil d'identificar perquè el projecte es diu "Tails" i l'apuntaire ha posat "Trails" però al menys al tenir una majúscula podria considerar-ho nom propi i deixar-ho com a dubte per edició humana, no aplicar el canvi. D'altra banda "Tails" surt en el mateix text i no ho ha corregit; que surti un nom propi amb majúscula inicial o unes sigles totes en majúscula vàries vegades dins un text, podria ser un indicador que s'ha de mantenir? I si surt una paraula molt similar en el mateix text, podria ser un indicador que aquella té un error? ref
  • [X] "prtotonmail" > "ProtonMail" / Fantàstic! Ha estat capaç d'identificar-ho i corregir-ho, tot i l'error d'escriptura. ref
  • [4] "Espais Contrabandos" > "Espais Contrabandes" > "Espai Contrabandos" ref
  • [5] "Commons Cloud" > "Commons Clou" > "CommonsCloud" ref

Correccions estranyes[ ]

  • [X] " En no considerar el procés" > "Com que no (...) el procés" > No calia corregir / No s'entén d'on surt la correcció amb "(...)" afegit. ref
  • [X] "dona" > "dóna" > "dona" / corregeix adequadament però amb la ortografia antiga, ja que ara aquest diacrític no es fa servir ref
  • [X] "Les residències tal com són ara no poden ser." > "Les residències tal com són no poden ser." / per alguna raó treu innecessàriament "ara", és incorrecte gramaticalment? si posés "actualment" seria correcte? ref
  • [X] "Barakaldo" > "Bargalló" > "Barakaldo" / Sembla que té "Bargalló" identificat com a nom propi però no "Barakaldo". Hauríem de protegir d'alguna manera els noms de lloc. Investigar (per exemple OSM toponímia) ref