GitHub - QDelta/LLM-for-FSCQ

This is the artifact for HotOS 2025 paper: Can Large Language Models Verify System Software? A Case Study Using FSCQ as a Benchmark.

All the model-generated proofs used for evaluation are located in generated directory.

Prepare

Use OPAM, run

opam install . --deps-only
opam install coq
opam install coq-serapi

Set environment variable OPENAI_API_KEY or GOOGLE_API_KEY for OpenAI/Gemini API token.
Run ./run.sh <MODEL> <HINT_RATE> <SAMPLE_RATE> For example, ./run.sh gpt-4o-2024-11-20 0.5 0.05

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
fscq @ e7c4a64		fscq @ e7c4a64
generated		generated
src		src
tiktoken-cli		tiktoken-cli
.gitignore		.gitignore
.gitmodules		.gitmodules
LICENSE		LICENSE
README.md		README.md
dune		dune
dune-project		dune-project
lCoq.opam		lCoq.opam
run.sh		run.sh