Friulian (fur) subword embeddings

Vocab size vocab model 25 dim 50 dim 100 dim 200 dim 300 dim
1000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
3000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
5000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
10000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
25000 vocab model txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix
txt | bin
bokeh | umap | matrix

Training corpus sample, encoded with different BPE vocabulary sizes

Vocab sizefurwiki sample
original in famee cul piçul wolfgang a jerin il pari leopold, om dal caratar suturni, plen di ideâi dal iluminisim, straneôs e spreçant, compositôr, violinist
figure:sandro botticelli - la nascita di venere - google art project - edited.jpg ''le nassite di venere''
statue di michêlagnul a florence (museu dai ufizîs) i ultims progjês de sô vite son: il disen dal progjet de puarte pia, opare impuartante, e il progj
1000 ▁in ▁famee ▁cul ▁piç ul ▁w ol f gan g ▁a ▁jerin ▁il ▁par i ▁le op ol d , ▁om ▁dal ▁car at ar ▁s ut ur n i , ▁pl en ▁di ▁i de âi ▁dal ▁il um in isim , ▁str ane ôs ▁e ▁sp re ç ant , ▁comp os it ôr , ▁vi ol in ist
▁figure : s and ro ▁b ot t ic el li ▁- ▁la ▁n as c it a ▁di ▁ven ere ▁- ▁g o og le ▁art ▁pro je c t ▁- ▁e di te d . jpg ▁'' le ▁n as si te ▁di ▁ven ere ''
▁st at ue ▁di ▁m ich ê la gn ul ▁a ▁fl or ence ▁( m us e u ▁dai ▁u f iz îs ) ▁i ▁ult im s ▁pro gj ês ▁de ▁sô ▁vite ▁son : ▁il ▁dis en ▁dal ▁pro gje t ▁de ▁pu arte ▁pi a , ▁opare ▁impuart ante , ▁e ▁il ▁pro gj
3000 ▁in ▁famee ▁cul ▁piçul ▁w olf gan g ▁a ▁jerin ▁il ▁pari ▁le op old , ▁om ▁dal ▁carat ar ▁s ut ur ni , ▁pl en ▁di ▁ide âi ▁dal ▁il um in isim , ▁str ane ôs ▁e ▁sp re ç ant , ▁compositôr , ▁viol inist
▁figure : s and ro ▁b ott ic elli ▁- ▁la ▁nas c it a ▁di ▁ven ere ▁- ▁g o og le ▁art ▁pro je c t ▁- ▁e di te d . jpg ▁'' le ▁nassite ▁di ▁ven ere ''
▁stat ue ▁di ▁michêlagnul ▁a ▁flor ence ▁( m use u ▁dai ▁uf iz îs ) ▁i ▁ult im s ▁pro gj ês ▁de ▁sô ▁vite ▁son : ▁il ▁dis en ▁dal ▁progjet ▁de ▁puarte ▁pi a , ▁opare ▁impuartante , ▁e ▁il ▁pro gj
5000 ▁in ▁famee ▁cul ▁piçul ▁wolf gan g ▁a ▁jerin ▁il ▁pari ▁leop old , ▁om ▁dal ▁caratar ▁s ut ur ni , ▁plen ▁di ▁ide âi ▁dal ▁il um in isim , ▁str ane ôs ▁e ▁sp re ç ant , ▁compositôr , ▁viol inist
▁figure : s and ro ▁b ott ic elli ▁- ▁la ▁nas c ita ▁di ▁ven ere ▁- ▁go og le ▁art ▁pro je ct ▁- ▁e dite d . jpg ▁'' le ▁nassite ▁di ▁ven ere ''
▁statue ▁di ▁michêlagnul ▁a ▁florence ▁( m use u ▁dai ▁uf iz îs ) ▁i ▁ult ims ▁pro gj ês ▁de ▁sô ▁vite ▁son : ▁il ▁dis en ▁dal ▁progjet ▁de ▁puarte ▁pi a , ▁opare ▁impuartante , ▁e ▁il ▁pro gj
10000 ▁in ▁famee ▁cul ▁piçul ▁wolfgang ▁a ▁jerin ▁il ▁pari ▁leopold , ▁om ▁dal ▁caratar ▁sut ur ni , ▁plen ▁di ▁ide âi ▁dal ▁ilum in isim , ▁str ane ôs ▁e ▁sp reç ant , ▁compositôr , ▁viol inist
▁figure : sand ro ▁botticelli ▁- ▁la ▁nas c ita ▁di ▁venere ▁- ▁go og le ▁art ▁pro je ct ▁- ▁e dite d . jpg ▁'' le ▁nassite ▁di ▁venere ''
▁statue ▁di ▁michêlagnul ▁a ▁florence ▁( muse u ▁dai ▁uf iz îs ) ▁i ▁ultims ▁pro gjês ▁de ▁sô ▁vite ▁son : ▁il ▁disen ▁dal ▁progjet ▁de ▁puarte ▁pi a , ▁opare ▁impuartante , ▁e ▁il ▁pro gj
25000 ▁in ▁famee ▁cul ▁piçul ▁wolfgang ▁a ▁jerin ▁il ▁pari ▁leopold , ▁om ▁dal ▁caratar ▁sut ur ni , ▁plen ▁di ▁ideâi ▁dal ▁iluminisim , ▁str ane ôs ▁e ▁sp reç ant , ▁compositôr , ▁violinist
▁figure : sand ro ▁botticelli ▁- ▁la ▁nas cita ▁di ▁venere ▁- ▁google ▁art ▁pro ject ▁- ▁e dited . jpg ▁'' le ▁nassite ▁di ▁venere ''
▁statue ▁di ▁michêlagnul ▁a ▁florence ▁( museu ▁dai ▁uf izîs ) ▁i ▁ultims ▁pro gjês ▁de ▁sô ▁vite ▁son : ▁il ▁disen ▁dal ▁progjet ▁de ▁puarte ▁pia , ▁opare ▁impuartante , ▁e ▁il ▁pro gj