donderdag 14 oktober 2021

Native tags

Geautenticeerde Members voeren Stories in. Die Stories krijgen Tags van type: 'counter', 'keyword','native', 'story', 'question', 'reaction', 'url', 'human', 'email', 'telephone'.

Keyword tags
zijn de "onderwerpen" die, zoals voorheen in prevald, voor ordening worden gebruikt. Een Member geeft handmatig aan welke onderwerp-Tag in de Story besproken is. (En plaatst die tag in een hiërarchische context.)

Door selectie van zo'n tag werden bijpassende stories getoond.

Native tags
Nu gaan we, daarnaast, het woordgebruik zelf er voor benutten

'alle woorden zijn tags'.

Natuurlijk zijn niet alle woorden even bepalend voor een story. Lidwoorden en koppelwerkwoorden bijvoorbeeld worden overal gebruikt. Het is de bedoeling dat de typerende woorden er uitspringen.

Het algoritme telt en indexeert alle gebruikte woorden. Het aantal woorden in de Tags-database bijelkaar noemen we N. En van elk gebruikt woord (i) weten we dan de globale frequentie: N(i).

Het quotiënt N(i)/N noemen we de globale proportie van woord (i).

Dit doen we ook voor elke ingevoerde story (s) met n(s) woorden. Woord (i) komt n(s,i) keer voor in de story. Dat is de lokale frequentie van woord (i) in (s).

De lokale proportie van woord (i) in story (s) is dan het quotiënt n(s,i)/n(s)

Ieder woord in elke story heeft een waarde van de lokale proportie / globale proportie (n(s,i)/n(s))/(N(i)/N) = (N/n(s))*(n(s,i)/N(i))
Laat die waarde de rangorde bepalen voor woord (i) in story (s).

Met een hoge rangorde typeert het woord vervolgens de story.
Het woord is dan een native tag.