LChoshen, to llm
@LChoshen@sigmoid.social avatar

Do LLMs learn foundational concepts required to build world models? (less than expected)

We address this question with 🌐🐨EWoK (Elements of World Knowledge)🐨🌐

a flexible cognition-inspired framework to test knowledge across physical and social domains

https://ewok-core.github.io

#llm #llms #evaluation #ml #machinelearning

vohwinkel, to Wuppertal German
Sousse, to tunisia French
@Sousse@mastodon.tn avatar

La lance la solution informatique “RASME“ en
La de (BAD) lance en Tunisie la solution informatique « RASME de collecte, d’analyse et de traitement de données en temps réel » en vue de renforcer la supervision des projets de développement.

https://www.leconomistemaghrebin.com/2024/02/10/bad-lance-solution-informatique-rasme-tunisie/

-Enabling

ParisWriters, to Letters

receives another devastating letter from Bill Ackman, detailing the reasons why the university should fire President, Claudine Gay

(‘ In her short tenure as President, Claudine Gay has done more damage to the reputation of Harvard University than any individual in our nearly 500-year history’)

It is a very good letter.

https://twitter.com/BillAckman/status/1733985787455168906

nicolay_lilicre, to random French
@nicolay_lilicre@piaille.fr avatar

Je vais faire une en travail de en

Les seront attitrés et distribués sous forme de carte (cf image jointe).

Ils changeront de rôle toutes les 10 minutes.

J'explique un peu comment va se passer l'évaluation (sans montrer les cartes ^^).

Une élève : Monsieur, c'est quand l'évaluation ?
Moi : Lundi, la prochaine fois qu'on se voit.
La classe : Trop bien !

Trop hâte 😃

J'ai mis le pdf et le odp sur , à retrouver ici :
https://forge.aeif.fr/ciaconelli/lmdbt.fr-la-texiotheque/-/tree/main/Divers

:cc: :ccby:

Photos des cartes imprimées et découpées sur des feuilles cartonnées de couleurs pastelles.

nicolay_lilicre,
@nicolay_lilicre@piaille.fr avatar

Bonsoir à tous ! 👋

📝 J'ai rédigé un billet détaillant cette récente pédagogique 👨‍🏫 en classe de :
une forme d' en groupe basée sur des dynamiques pour stimuler la et l'.

J'y détaille les modalités de "mise en place" et de "règlement".

🔗 Sur dans (faute de mieux pour l'instant 🙃)⤵️
https://ciaconelli.forge.aeif.fr/lmdbt.fr-la-texiotheque/eval_groupe_regles.html

Va, to random French
@Va@piaille.fr avatar


Je suis vraiment une drôle d'instit. Les résultats de mes CM1 que j'avais déjà au CE2 sont à l'inverse des résultats académiques. Mais alors totalement.

Dorianix, to random German
@Dorianix@graz.social avatar

Kann es wirklich sein, dass das für in keine von und deren Vortragenden macht?

Weiß dazu jemand was?
Ist das normal?

linos,
@linos@graz.social avatar

@Dorianix @publicvoit Oft wird vielleicht auch nur zyklisch alle paar Jahre evaluiert. Und an der haben manche Vorlesungen oder Übungen es geschafft mehr als ein Jahrzehnt ohne aus zu kommen, weil sie leider immer dann, wenn das Institut evaluiert wurde, nicht angeboten wurden.

academia_carnet, to random French

🧐 7 septembre 2023

@adirlabos fait le bilan de la campagne @Hceres_ et
"s’interroge sur les finalités d’un tel processus bureaucratique d’ et ne comprend pas que le coût de celui-ci ne soit jamais lui-même évalué"

https://academia.hypotheses.org/51718

steamworkgroup, to random

Solid opportunity to work with NEA staff on arts program evaluation. Despite the limiting name, it covers all aspects of evaluation, not just analysis. More info is at the link.

Position is in Washington DC.

Salary $94-145k

Closing date Sept 6

https://www.usajobs.gov/job/744614800

Private
steamworkgroup,

@lisseuse @museum @classicalmusic My potential questions about Orff depend on who I am - the roles, identities, and motivations I'm bringing to my visit. Nevermind the mission of the museum and the intended audiences. (Sorry for the evaluator answer of "it depends," yet it's an honest one!)

stephaniewalter, to accessibility
@stephaniewalter@front-end.social avatar

Top Tips from a Web Accessibility Evaluator at WebAIM: https://webaim.org/blog/top-evaluation-tips/
Great pieces of advice to help you evaluate the accessibility of a website: evaluate piece by piece (header, main regions, footer), search for patterns, create your own checklist to help, etc.

gerald_leppert, to random
ThunderHoney, to philosophy

Post submission snooze. Thesis is out in the world for evaluation. No editing or writing for a while. Time for some much needed downtime.
#PhDLife #Thesis #Submitted #Writing #Evaluation #Dog #DogsOfMastodon #Nap #PuppyLove #WritingBuddy #Rest #AmEditing #AmWriting #RestAndRecovery #SleepyPuppy

ThomasRhysEvans, to psychology

Just finished ‘Evaluating What Works’ by @deevybee & Paul Thompson. A really good primer on how to evaluate and, despite the speech and language therapy context, I found it highly relevant to & .

I’ll be adding this to my module’s reading list, but unfortunately I can’t put it on my Goodreads :ablobcatcry:

Read online for free:
https://bookdown.org/dorothy_bishop/Evaluating_What_Works/

ErikJonker, to ai
@ErikJonker@mastodon.social avatar

Suppose i would like to measure the amount of bias, discrimination, hallucination etc in tools like Bard, Bing, ChatGPT and others. Are there already standards and tools to measure that ?
There will be discussions whether model A is better/worse then model B, it would be nice to have some standards/benchmarks for evaluation ? 🤔

VanessaEr, to food


Hello, I’m a and researcher, an , and a . living in the . Public library champion. Fan of shows. and in spare time (if any!)

Research interests include , , .

I will mainly be tooting about , , , ’sFootball, , , and

  • All
  • Subscribed
  • Moderated
  • Favorites
  • megavids
  • mdbf
  • ngwrru68w68
  • tester
  • magazineikmin
  • thenastyranch
  • rosin
  • khanakhh
  • InstantRegret
  • Youngstown
  • slotface
  • Durango
  • kavyap
  • DreamBathrooms
  • JUstTest
  • tacticalgear
  • osvaldo12
  • normalnudes
  • cubers
  • cisconetworking
  • everett
  • GTA5RPClips
  • ethstaker
  • Leos
  • provamag3
  • anitta
  • modclub
  • lostlight
  • All magazines