Submissions from oxrml.com

		Measuring What Matters: Construct Validity in Large Language Model Benchmarks (oxrml.com)
		3 points by Cynddl 72 days ago \| past \| 2 comments