rishu

rishu / Words_Frequency_Counter / 0.4.2

README.md

Description

This Algorithm is built to count frequency of words in a .txt/.csv file.

Input

Sample input one

From online link as source

"https://filesamples.com/samples/document/txt/sample3.txt"

Sample input two

From offline link as source

"data://rishu/files/biostats.csv"

Output

For sample input one

{
  "ab": 1,
  "abducas": 1,
  "absurdum": 1,
  "ac": 1,
  "accesserit": 1,
  "ad": 5,
  "adhuc": 1,
  "adipiscing": 1,
  "advesperascit": 1,
  "aggrediar": 1,
  "agimus": 1,
  "alienum": 1,
  "aliunde": 1,
  "amet": 1,
  "animantibus": 1,
  "animi": 1,
  "animoque": 1,
  "ante": 1,
  "antiochum": 1,
  "appetitum": 1,
  "apprehendas": 1,
  "apta": 1,
  "architectari": 1,
  "aristonem": 1,
  "atqui": 1,
  "audissem": 1,
  "audiunt": 1,
  "audivi": 1,
  "autem": 4,
  "b": 1,
  "beate": 2,
  "beato": 1,
  "beatos": 1,
  "bene": 1,
  "bestiarum": 1,
  "bona": 1,
  "bonum": 1,
  "brute": 1,
  "callida": 1,
  "causam": 1,
  "ceteris": 1,
  "ciceronem": 1,
  "cn": 1,
  "coerceas": 1,
  "cogit": 1,
  "communia": 1,
  "conantur": 1,
  "condemnatus": 1,
  "congressu": 1,
  "consectetur": 1,
  "constare": 1,
  "constructio": 1,
  "convincunturque": 1,
  "cor": 1,
  "corpore": 1,
  "corporis": 1,
  "corpus": 1,
  "cuius": 2,
  "cuiusque": 1,
  "cum": 8,
  "cur": 1,
  "danda": 1,
  "datum": 1,
  "de": 1,
  "deinde": 2,
  "delectant": 1,
  "delicatior": 1,
  "desciscendi": 1,
  "desidero": 1,
  "dicam": 1,
  "dicas": 2,
  "dicemus": 1,
  "diceret": 1,
  "dicet": 1,
  "dicis": 1,
  "dicitur": 2,
  "dicta": 1,
  "dies": 1,
  "dissentias": 1,
  "dixerunt": 1,
  "dixti": 1,
  "doctrina": 1,
  "dolor": 2,
  "dolorem": 1,
  "dubitabit": 1,
  "dubium": 1,
  "duo": 1,
  "e": 2,
  "ea": 2,
  "eam": 1,
  "ego": 1,
  "eius": 2,
  "elegantiora": 1,
  "elit": 1,
  "enim": 5,
  "eo": 1,
  "eorum": 1,
  "eos": 1,
  "equidem": 2,
  "erunt": 1,
  "esse": 8,
  "est": 8,
  "et": 6,
  "etiam": 2,
  "facturam": 1,
  "falsone": 1,
  "fatebuntur": 1,
  "fertur": 1,
  "fieri": 1,
  "finem": 1,
  "fingunt": 1,
  "fratri": 1,
  "fuerit": 1,
  "fuisse": 2,
  "gerendae": 1,
  "grandioribus": 1,
  "grata": 1,
  "gravitasque": 1,
  "habeat": 1,
  "habere": 1,
  "habes": 1,
  "hactenus": 1,
  "haec": 2,
  "historia": 1,
  "hoc": 2,
  "hominem": 1,
  "homini": 1,
  "huc": 1,
  "humanis": 1,
  "hunc": 1,
  "iam": 1,
  "id": 2,
  "idem": 1,
  "igitur": 2,
  "illa": 2,
  "illud": 1,
  "illum": 1,
  "incendi": 1,
  "incidere": 1,
  "iniquus": 1,
  "inponere": 1,
  "inpune": 1,
  "inquam": 2,
  "inquit": 1,
  "institutionis": 1,
  "institutis": 1,
  "instructum": 1,
  "interrete": 1,
  "ipsa": 3,
  "ipsae": 1,
  "ipse": 1,
  "ipsius": 1,
  "ipso": 1,
  "ipsum": 4,
  "ista": 2,
  "isti": 1,
  "istis": 1,
  "istuc": 1,
  "istum": 1,
  "ita": 6,
  "item": 1,
  "iucunde": 1,
  "iudicium": 1,
  "iure": 1,
  "iustus": 1,
  "latine": 1,
  "lex": 1,
  "liberalis": 1,
  "licebit": 1,
  "lucius": 1,
  "magis": 1,
  "mala": 1,
  "malorum": 1,
  "malum": 1,
  "manere": 1,
  "maximam": 1,
  "maximum": 1,
  "memoria": 1,
  "mene": 1,
  "meum": 1,
  "mihi": 5,
  "mittimus": 1,
  "modi": 1,
  "modo": 3,
  "molliorque": 1,
  "moribus": 1,
  "moveatur": 1,
  "multa": 1,
  "mundum": 1,
  "n": 5,
  "nam": 1,
  "natura": 3,
  "naturam": 1,
  "ne": 3,
  "nec": 2,
  "neglegi": 1,
  "neque": 2,
  "nescio": 1,
  "nesse": 1,
  "nex": 1,
  "nhaec": 1,
  "nhoc": 1,
  "niam": 1,
  "nidemne": 1,
  "nihil": 4,
  "nlorem": 1,
  "nomina": 1,
  "non": 12,
  "nostrum": 1,
  "nova": 1,
  "nquae": 1,
  "nquem": 1,
  "nquis": 1,
  "nquod": 1,
  "nstulti": 1,
  "nsummus": 1,
  "nullo": 1,
  "nullum": 1,
  "nunc": 2,
  "nusquam": 1,
  "nverum": 1,
  "nvoluptatem": 1,
  "oblita": 1,
  "obruat": 1,
  "occurrentia": 1,
  "oculis": 1,
  "omnem": 1,
  "omnes": 1,
  "omnia": 1,
  "omnis": 2,
  "opera": 1,
  "oppidum": 1,
  "optime": 1,
  "optineat": 1,
  "oratio": 1,
  "orationem": 1,
  "p": 1,
  "pacto": 1,
  "palatum": 1,
  "paria": 1,
  "partem": 1,
  "partes": 1,
  "parum": 2,
  "per": 1,
  "perspicuum": 1,
  "peti": 1,
  "philosophiae": 1,
  "philosophis": 1,
  "plane": 1,
  "plures": 1,
  "plurimum": 1,
  "popularia": 1,
  "possit": 1,
  "postulat": 1,
  "poterat": 1,
  "potest": 3,
  "praecipue": 1,
  "praeclare": 1,
  "praestat": 1,
  "praeterita": 1,
  "prima": 1,
  "primae": 2,
  "primum": 1,
  "principia": 1,
  "privasse": 1,
  "pro": 1,
  "probata": 1,
  "probes": 1,
  "probitate": 1,
  "promptu": 1,
  "protulisti": 1,
  "putas": 1,
  "puto": 2,
  "qua": 1,
  "quae": 4,
  "quaerere": 1,
  "quam": 3,
  "quamvis": 1,
  "quanta": 1,
  "quasi": 1,
  "quendam": 1,
  "qui": 3,
  "quibus": 1,
  "quid": 3,
  "quidem": 4,
  "quin": 1,
  "quo": 1,
  "quod": 10,
  "quoniam": 1,
  "quoque": 1,
  "quos": 1,
  "rapiat": 1,
  "rapidam": 1,
  "rapiunt": 1,
  "ratio": 3,
  "rebus": 3,
  "recordatione": 1,
  "redarguitur": 1,
  "referas": 1,
  "reges": 1,
  "rei": 1,
  "reliquas": 1,
  "renovata": 1,
  "reprehendo": 1,
  "res": 1,
  "responderit": 1,
  "revertendum": 1,
  "rogatione": 1,
  "sapiens": 1,
  "sapientem": 1,
  "sapientes": 2,
  "satis": 1,
  "scripta": 1,
  "scriptis": 1,
  "se": 3,
  "secundae": 1,
  "sed": 5,
  "semper": 1,
  "sensus": 1,
  "sequitur": 1,
  "sese": 1,
  "si": 5,
  "sic": 1,
  "sint": 1,
  "sit": 3,
  "solebam": 1,
  "solemus": 1,
  "solum": 1,
  "stoici": 1,
  "suae": 1,
  "summa": 1,
  "summum": 1,
  "sunt": 3,
  "tamen": 2,
  "te": 4,
  "teneas": 1,
  "tenueris": 1,
  "tibi": 1,
  "timet": 1,
  "torquentur": 1,
  "torrens": 1,
  "triari": 1,
  "tu": 3,
  "tubulum": 1,
  "tum": 1,
  "tuum": 1,
  "ut": 6,
  "valde": 1,
  "velle": 1,
  "vellet": 1,
  "vera": 1,
  "verba": 1,
  "vere": 1,
  "vero": 3,
  "verum": 2,
  "vestra": 1,
  "vestro": 1,
  "vide": 1,
  "video": 1,
  "videretur": 1,
  "videro": 1,
  "vides": 1,
  "videtur": 1,
  "vidit": 1,
  "villam": 1,
  "vincunt": 1,
  "virtus": 2,
  "virtutis": 1,
  "vis": 1,
  "vitem": 1,
  "vivendi": 1,
  "vivendum": 1,
  "voluptates": 1,
  "zenoni": 1
}

For sample input two

{
  "age": 1,
  "alex": 1,
  "bert": 1,
  "carl": 1,
  "dave": 1,
  "elly": 1,
  "f": 7,
  "fran": 1,
  "gwen": 1,
  "hank": 1,
  "height": 1,
  "ivan": 1,
  "jake": 1,
  "kate": 1,
  "lbs": 1,
  "luke": 1,
  "myra": 1,
  "name": 1,
  "neil": 1,
  "omar": 1,
  "page": 1,
  "quin": 1,
  "ruth": 1,
  "sex": 1,
  "weight": 1
}

Limitations

As there is no module added for .docx file that cant be used for input