scripts/stbl-crossval: initial WIP draft

2024-12-22 14:15:01 +00:00 · 2024-12-20 15:11:41 +00:00 · 2024-12-20 15:11:41 +00:00 · fda40b05c9
commit fda40b05c9
parent f8a1e1b594
1 changed files with 76 additions and 0 deletions
--- a/aimodel/scripts/stbl-crossval.py
+++ b/aimodel/scripts/stbl-crossval.py
@ -0,0 +1,76 @@
+#!/usr/bin/env python3
+
+import os
+import sys
+
+from loguru import logger
+import pandas as pd
+
+# This script analyses metrics.tsv files from a series of identical experiments and reports metrics on them.
+# This is sometimes known as cross-validation, but we usually use the model series code crossval-stblX, where X is an integer >0.
+
+
+if len(sys.argv) <= 1:
+	print("""
+Usage:
+	scripts/stbl-crossval.mjs {{path/to/directory}}
+
+...in which the given directory contains a series of experiment root directories to include in the statistical analysis.
+
+This script is not picky about the format of the data in metrics.tsv, so long as it's in the form:
+
+epoch	metric_A	metric_B	…
+0	val:float	val:float	…
+1	val:float	val:float	…
+2	val:float	val:float	…
+⋮
+""")
+	sys.exit(0)
+
+DIRPATH = sys.argv[1]  # [0] == script path
+
+files = 0
+metrics = {}
+
+for filepath in os.scandir(DIRPATH):
+	tbl = pd.read_csv(os.path.join(filepath, "metrics.tsv"), sep="\t")
+
+	# metrics.append(tbl)
+
+	for column in tbl.columns:
+		if column == "epoch":
+			continue  # Row index implicitly retains this
+
+		if column not in metrics:
+			metrics[column] = []
+
+		metrics[column].append(tbl[column].values)
+		# print(column, tbl[column])
+
+	# print("DEBUG:metrics", tbl)
+	files += 1
+
+logger.info(f"Read {files} files into crossval-stbl{files} analysis")
+
+stats = {}
+
+for metric in metrics.keys():
+	metrics[metric] = pd.DataFrame(metrics[metric]).transpose()
+
+	if metric not in stats:
+		stats[metric] = {}
+
+	stats[metric]["aad"] = metrics[metric].max(axis=1) # mean/average absolute deviation
+	stats[metric]["mad"] = metrics[metric].max(axis=1) # median absolute deviation
+	stats[metric]["stddev"] = metrics[metric].std(axis=1)
+	stats[metric]["mean"] = metrics[metric].mean(axis=1)
+	stats[metric]["min"] = metrics[metric].min(axis=1)
+	stats[metric]["max"] = metrics[metric].max(axis=1)
+	stats[metric]["agg_min"] = stats[metric]["min"].min()
+	stats[metric]["agg_max"] = stats[metric]["max"].max()
+	stats[metric]["agg_stddev"] = metrics[metric].stack().std()
+	stats[metric]["agg_mean"] = metrics[metric].stack().std()
+	stats[metric]["agg_aad"] = metrics[metric].stack().max() # mean/average absolute deviation
+
+	print(stats[metric])
+