ggml-org · harvestingmoon · Feb 16, 2025 · Feb 16, 2025 · Feb 17, 2025 · Feb 18, 2025
diff --git a/.gitignore b/.gitignore
@@ -52,6 +52,7 @@ models/*.mlpackage
 bindings/java/.gradle/
 bindings/java/.idea/
 .idea/
+models/ggml-base.en.bin
 
 benchmark_results.csv
 cmake-build-debug/

diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/WhisperContext.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/WhisperContext.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/WhisperCpp.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/WhisperCpp.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/WhisperCppJnaLibrary.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/WhisperCppJnaLibrary.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/bean/WhisperSegment.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/bean/WhisperSegment.class
diff --git a/.../java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperEncoderBeginCallback.class b/.../java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperEncoderBeginCallback.class
diff --git a/.../java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperLogitsFilterCallback.class b/.../java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperLogitsFilterCallback.class
diff --git a/...gs/java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperNewSegmentCallback.class b/...gs/java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperNewSegmentCallback.class
diff --git a/...ings/java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperProgressCallback.class b/...ings/java/bin/main/io/github/ggerganov/whispercpp/callbacks/WhisperProgressCallback.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/ggml/GgmlTensor.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/ggml/GgmlTensor.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/ggml/GgmlType.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/ggml/GgmlType.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/EModel.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/EModel.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModel.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModel.class
diff --git a/...java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$CloseCallback.class b/...java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$CloseCallback.class
diff --git a/...java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$CloseFunction.class b/...java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$CloseFunction.class
diff --git a/...s/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$EOFCallback.class b/...s/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$EOFCallback.class
diff --git a/...s/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$EOFFunction.class b/...s/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$EOFFunction.class
diff --git a/.../java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$ReadCallback.class b/.../java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$ReadCallback.class
diff --git a/.../java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$ReadFunction.class b/.../java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader$ReadFunction.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperModelLoader.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperState.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperState.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperTokenData.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/model/WhisperTokenData.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/BeamSearchParams.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/BeamSearchParams.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/CBool.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/CBool.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/GreedyParams.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/GreedyParams.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperContextParams.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperContextParams.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperFilters.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperFilters.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperFullParams.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperFullParams.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperHParams.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperHParams.class
diff --git a/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperSamplingStrategy.class b/bindings/java/bin/main/io/github/ggerganov/whispercpp/params/WhisperSamplingStrategy.class
diff --git a/bindings/java/bin/test/io/github/ggerganov/whispercpp/WhisperCppTest.class b/bindings/java/bin/test/io/github/ggerganov/whispercpp/WhisperCppTest.class
diff --git a/bindings/java/bin/test/io/github/ggerganov/whispercpp/WhisperJnaLibraryTest.class b/bindings/java/bin/test/io/github/ggerganov/whispercpp/WhisperJnaLibraryTest.class
diff --git a/wer_testing/6097_5_mins/audio/astralplane_03_leadbeater_0639.wav b/wer_testing/6097_5_mins/audio/astralplane_03_leadbeater_0639.wav
diff --git a/wer_testing/6097_5_mins/audio/astralplane_04_leadbeater_0040.wav b/wer_testing/6097_5_mins/audio/astralplane_04_leadbeater_0040.wav
diff --git a/wer_testing/6097_5_mins/audio/astralplane_06_leadbeater_0349.wav b/wer_testing/6097_5_mins/audio/astralplane_06_leadbeater_0349.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_02_haggard_0323.wav b/wer_testing/6097_5_mins/audio/bambatse_02_haggard_0323.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_04_haggard_0273.wav b/wer_testing/6097_5_mins/audio/bambatse_04_haggard_0273.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_06_haggard_0090.wav b/wer_testing/6097_5_mins/audio/bambatse_06_haggard_0090.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_06_haggard_0163.wav b/wer_testing/6097_5_mins/audio/bambatse_06_haggard_0163.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_06_haggard_0280.wav b/wer_testing/6097_5_mins/audio/bambatse_06_haggard_0280.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_07_haggard_0054.wav b/wer_testing/6097_5_mins/audio/bambatse_07_haggard_0054.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_07_haggard_0195.wav b/wer_testing/6097_5_mins/audio/bambatse_07_haggard_0195.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_10_haggard_0284.wav b/wer_testing/6097_5_mins/audio/bambatse_10_haggard_0284.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_13_haggard_0083.wav b/wer_testing/6097_5_mins/audio/bambatse_13_haggard_0083.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_15_haggard_0013.wav b/wer_testing/6097_5_mins/audio/bambatse_15_haggard_0013.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_15_haggard_0247.wav b/wer_testing/6097_5_mins/audio/bambatse_15_haggard_0247.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_19_haggard_0301.wav b/wer_testing/6097_5_mins/audio/bambatse_19_haggard_0301.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_20_haggard_0146.wav b/wer_testing/6097_5_mins/audio/bambatse_20_haggard_0146.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_20_haggard_0331.wav b/wer_testing/6097_5_mins/audio/bambatse_20_haggard_0331.wav
diff --git a/wer_testing/6097_5_mins/audio/bambatse_22_haggard_0394.wav b/wer_testing/6097_5_mins/audio/bambatse_22_haggard_0394.wav
diff --git a/wer_testing/6097_5_mins/audio/glitteringplain_07_morris_0054.wav b/wer_testing/6097_5_mins/audio/glitteringplain_07_morris_0054.wav
diff --git a/wer_testing/6097_5_mins/audio/glitteringplain_09_morris_0119.wav b/wer_testing/6097_5_mins/audio/glitteringplain_09_morris_0119.wav
diff --git a/wer_testing/6097_5_mins/audio/glitteringplain_11_morris_0037.wav b/wer_testing/6097_5_mins/audio/glitteringplain_11_morris_0037.wav
diff --git a/wer_testing/6097_5_mins/audio/glitteringplain_14_morris_0155.wav b/wer_testing/6097_5_mins/audio/glitteringplain_14_morris_0155.wav
diff --git a/wer_testing/6097_5_mins/audio/glitteringplain_15_morris_0108.wav b/wer_testing/6097_5_mins/audio/glitteringplain_15_morris_0108.wav
diff --git a/wer_testing/6097_5_mins/audio/glitteringplain_20_morris_0336.wav b/wer_testing/6097_5_mins/audio/glitteringplain_20_morris_0336.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_01_fawcett_0317.wav b/wer_testing/6097_5_mins/audio/hartmann_01_fawcett_0317.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_04_fawcett_0191.wav b/wer_testing/6097_5_mins/audio/hartmann_04_fawcett_0191.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_05_fawcett_0100.wav b/wer_testing/6097_5_mins/audio/hartmann_05_fawcett_0100.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_08_fawcett_0171.wav b/wer_testing/6097_5_mins/audio/hartmann_08_fawcett_0171.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_11_fawcett_0056.wav b/wer_testing/6097_5_mins/audio/hartmann_11_fawcett_0056.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_11_fawcett_0337.wav b/wer_testing/6097_5_mins/audio/hartmann_11_fawcett_0337.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_12_fawcett_0088.wav b/wer_testing/6097_5_mins/audio/hartmann_12_fawcett_0088.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_12_fawcett_0110.wav b/wer_testing/6097_5_mins/audio/hartmann_12_fawcett_0110.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_12_fawcett_0193.wav b/wer_testing/6097_5_mins/audio/hartmann_12_fawcett_0193.wav
diff --git a/wer_testing/6097_5_mins/audio/hartmann_15_fawcett_0148.wav b/wer_testing/6097_5_mins/audio/hartmann_15_fawcett_0148.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_00_lafon_0062.wav b/wer_testing/6097_5_mins/audio/jaufry_00_lafon_0062.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_01_lafon_0175.wav b/wer_testing/6097_5_mins/audio/jaufry_01_lafon_0175.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_02_lafon_0029.wav b/wer_testing/6097_5_mins/audio/jaufry_02_lafon_0029.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_03_lafon_0298.wav b/wer_testing/6097_5_mins/audio/jaufry_03_lafon_0298.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_05_lafon_0217.wav b/wer_testing/6097_5_mins/audio/jaufry_05_lafon_0217.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_06_lafon_0466.wav b/wer_testing/6097_5_mins/audio/jaufry_06_lafon_0466.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_07_lafon_0073.wav b/wer_testing/6097_5_mins/audio/jaufry_07_lafon_0073.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_08_lafon_0098.wav b/wer_testing/6097_5_mins/audio/jaufry_08_lafon_0098.wav
diff --git a/wer_testing/6097_5_mins/audio/jaufry_09_lafon_0365.wav b/wer_testing/6097_5_mins/audio/jaufry_09_lafon_0365.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_00_haggard_0218.wav b/wer_testing/6097_5_mins/audio/nada_lily_00_haggard_0218.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_02_haggard_0216.wav b/wer_testing/6097_5_mins/audio/nada_lily_02_haggard_0216.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_04_haggard_0027.wav b/wer_testing/6097_5_mins/audio/nada_lily_04_haggard_0027.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_04_haggard_0190.wav b/wer_testing/6097_5_mins/audio/nada_lily_04_haggard_0190.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_12_haggard_0130.wav b/wer_testing/6097_5_mins/audio/nada_lily_12_haggard_0130.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_12_haggard_0523.wav b/wer_testing/6097_5_mins/audio/nada_lily_12_haggard_0523.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_13_haggard_0035.wav b/wer_testing/6097_5_mins/audio/nada_lily_13_haggard_0035.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_15_haggard_0182.wav b/wer_testing/6097_5_mins/audio/nada_lily_15_haggard_0182.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_15_haggard_0288.wav b/wer_testing/6097_5_mins/audio/nada_lily_15_haggard_0288.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_17_haggard_0378.wav b/wer_testing/6097_5_mins/audio/nada_lily_17_haggard_0378.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_18_haggard_0386.wav b/wer_testing/6097_5_mins/audio/nada_lily_18_haggard_0386.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_20_haggard_0145.wav b/wer_testing/6097_5_mins/audio/nada_lily_20_haggard_0145.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_21_haggard_0169.wav b/wer_testing/6097_5_mins/audio/nada_lily_21_haggard_0169.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_21_haggard_0316.wav b/wer_testing/6097_5_mins/audio/nada_lily_21_haggard_0316.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_25_haggard_0351.wav b/wer_testing/6097_5_mins/audio/nada_lily_25_haggard_0351.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_26_haggard_0157.wav b/wer_testing/6097_5_mins/audio/nada_lily_26_haggard_0157.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_27_haggard_0177.wav b/wer_testing/6097_5_mins/audio/nada_lily_27_haggard_0177.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_30_haggard_0086.wav b/wer_testing/6097_5_mins/audio/nada_lily_30_haggard_0086.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_30_haggard_0368.wav b/wer_testing/6097_5_mins/audio/nada_lily_30_haggard_0368.wav
diff --git a/wer_testing/6097_5_mins/audio/nada_lily_32_haggard_0034.wav b/wer_testing/6097_5_mins/audio/nada_lily_32_haggard_0034.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_01_mann_0076.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_01_mann_0076.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_01_mann_0160.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_01_mann_0160.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_0083.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_0083.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_0532.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_0532.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_0962.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_0962.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_1095.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_02_mann_1095.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_04_mann_0197.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_04_mann_0197.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_04_mann_0473.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_04_mann_0473.wav
diff --git a/wer_testing/6097_5_mins/audio/presentpictureofnsw_05_mann_0592.wav b/wer_testing/6097_5_mins/audio/presentpictureofnsw_05_mann_0592.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_02_morris_0219.wav b/wer_testing/6097_5_mins/audio/roots_02_morris_0219.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_04_morris_0057.wav b/wer_testing/6097_5_mins/audio/roots_04_morris_0057.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_04_morris_0400.wav b/wer_testing/6097_5_mins/audio/roots_04_morris_0400.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_06_morris_0244.wav b/wer_testing/6097_5_mins/audio/roots_06_morris_0244.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_09_morris_0034.wav b/wer_testing/6097_5_mins/audio/roots_09_morris_0034.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_09_morris_0085.wav b/wer_testing/6097_5_mins/audio/roots_09_morris_0085.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_17_morris_0032.wav b/wer_testing/6097_5_mins/audio/roots_17_morris_0032.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_19_morris_0120.wav b/wer_testing/6097_5_mins/audio/roots_19_morris_0120.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_19_morris_0269.wav b/wer_testing/6097_5_mins/audio/roots_19_morris_0269.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_19_morris_0392.wav b/wer_testing/6097_5_mins/audio/roots_19_morris_0392.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_27_morris_0352.wav b/wer_testing/6097_5_mins/audio/roots_27_morris_0352.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_28_morris_0362.wav b/wer_testing/6097_5_mins/audio/roots_28_morris_0362.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_32_morris_0506.wav b/wer_testing/6097_5_mins/audio/roots_32_morris_0506.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_36_morris_0138.wav b/wer_testing/6097_5_mins/audio/roots_36_morris_0138.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_36_morris_0278.wav b/wer_testing/6097_5_mins/audio/roots_36_morris_0278.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_38_morris_0130.wav b/wer_testing/6097_5_mins/audio/roots_38_morris_0130.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_39_morris_0340.wav b/wer_testing/6097_5_mins/audio/roots_39_morris_0340.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_40_morris_0140.wav b/wer_testing/6097_5_mins/audio/roots_40_morris_0140.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_40_morris_0157.wav b/wer_testing/6097_5_mins/audio/roots_40_morris_0157.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_40_morris_0200.wav b/wer_testing/6097_5_mins/audio/roots_40_morris_0200.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_44_morris_0112.wav b/wer_testing/6097_5_mins/audio/roots_44_morris_0112.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_44_morris_0140.wav b/wer_testing/6097_5_mins/audio/roots_44_morris_0140.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_44_morris_0181.wav b/wer_testing/6097_5_mins/audio/roots_44_morris_0181.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_50_morris_0055.wav b/wer_testing/6097_5_mins/audio/roots_50_morris_0055.wav
diff --git a/wer_testing/6097_5_mins/audio/roots_50_morris_0154.wav b/wer_testing/6097_5_mins/audio/roots_50_morris_0154.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_01_gaskell_0158.wav b/wer_testing/6097_5_mins/audio/shortstories_01_gaskell_0158.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_05_gaskell_0338.wav b/wer_testing/6097_5_mins/audio/shortstories_05_gaskell_0338.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_05_gaskell_0539.wav b/wer_testing/6097_5_mins/audio/shortstories_05_gaskell_0539.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0340.wav b/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0340.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0370.wav b/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0370.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0676.wav b/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0676.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0776.wav b/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0776.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0784.wav b/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0784.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0920.wav b/wer_testing/6097_5_mins/audio/shortstories_06_gaskell_0920.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_10_gaskell_0142.wav b/wer_testing/6097_5_mins/audio/shortstories_10_gaskell_0142.wav
diff --git a/wer_testing/6097_5_mins/audio/shortstories_10_gaskell_0630.wav b/wer_testing/6097_5_mins/audio/shortstories_10_gaskell_0630.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_03_tompkins_0380.wav b/wer_testing/6097_5_mins/audio/swag_03_tompkins_0380.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_04_tompkins_0094.wav b/wer_testing/6097_5_mins/audio/swag_04_tompkins_0094.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_04_tompkins_0193.wav b/wer_testing/6097_5_mins/audio/swag_04_tompkins_0193.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_04_tompkins_0828.wav b/wer_testing/6097_5_mins/audio/swag_04_tompkins_0828.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_05_tompkins_0039.wav b/wer_testing/6097_5_mins/audio/swag_05_tompkins_0039.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_05_tompkins_0390.wav b/wer_testing/6097_5_mins/audio/swag_05_tompkins_0390.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_06_tompkins_0082.wav b/wer_testing/6097_5_mins/audio/swag_06_tompkins_0082.wav
diff --git a/wer_testing/6097_5_mins/audio/swag_06_tompkins_0883.wav b/wer_testing/6097_5_mins/audio/swag_06_tompkins_0883.wav
diff --git a/wer_testing/6097_5_mins/manifest.json b/wer_testing/6097_5_mins/manifest.json
diff --git a/wer_testing/Readme.md b/wer_testing/Readme.md
@@ -0,0 +1,15 @@
+# WER Testing For Whisper Cpp 
+
+## Instructions: (Take note, this must be only after you have downloaded and made the model, else you can reference to either YT or the main dir)
+
+### How it works:
+1. Just run ```WER_script.py```
+
+
+### What it does:
+It calculates the WER based off the dataset for speaker 6097 of the HiTTS dataset.
+
+Link to original dataset: https://docs.nvidia.com/deeplearning/riva/user-guide/docs/tutorials/tts-evaluate.html
+
+## Current WER:
+### Average: 0.3
diff --git a/wer_testing/WER_Script.py b/wer_testing/WER_Script.py
@@ -0,0 +1,166 @@
+import os
+import subprocess
+import re
+import csv
+import wave
+import contextlib
+import argparse
+import json
+
+# Custom action to handle comma-separated list
+class ListAction(argparse.Action):
+    def __call__(self, parser, namespace, values, option_string=None):
+        setattr(namespace, self.dest, [int(val) for val in values.split(",")])
+
+parser = argparse.ArgumentParser(description="Benchmark the speech recognition model")
+
+# Define the argument to accept a list
+parser.add_argument(
+    "-t",
+    "--threads",
+    dest="threads",
+    action=ListAction,
+    default=[4],
+    help="List of thread counts to benchmark (comma-separated, default: 4)",
+)
+
+parser.add_argument(
+    "-p",
+    "--processors",
+    dest="processors",
+    action=ListAction,
+    default=[1],
+    help="List of processor counts to benchmark (comma-separated, default: 1)",
+)
+
+
+parser.add_argument(
+    "-f",
+    "--filename",
+    type=str,
+    default="./6097_5_mins/",
+    help="Relative path of the file to transcribe (default: ./samples/jfk.wav)",
+)
+
+parser.add_argument(
+    "-s",
+    "--type_set", 
+    type=str, 
+    default="./6097_5_mins/manifest.json", 
+    help="Running WER set based on the validation / test set from the Commands Dataset\nSet path for the dataset"
+)
+
+# Parse the command line arguments
+args = parser.parse_args()
+models = [
+    "ggml-tiny.en.bin",
+    "ggml-tiny.bin",
+    "ggml-base.en.bin",
+    "ggml-base.bin",
+    "ggml-small.en.bin",
+    "ggml-small.bin",
+    "ggml-medium.en.bin",
+    "ggml-medium.bin",
+    "ggml-large-v1.bin",
+    "ggml-large-v2.bin",
+    "ggml-large-v3.bin",
+    "ggml-large-v3-turbo.bin",
+]
+
+validating_files = args.type_set
+sample_folder = args.filename
+threads = args.threads
+processors = args.processors
+
+def check_folder_exists(file: str) -> bool:
+    return os.path.isdir(file)
+
+def check_file_exists(file):
+    return os.path.isfile(file)
+
+
+if not check_folder_exists(sample_folder):
+    raise FileNotFoundError(f"Sample file {sample_folder} not found")
+
+filtered_models = []
+for model in models:
+    if check_file_exists(f"../models/{model}"):
+        filtered_models.append(model)
+    else:
+        print(f"Model {model} not found, removing from list")
+
+def filtered_text(output):
+    pattern = re.compile(r'\[\d{2}:\d{2}:\d{2}\.\d{3} --> \d{2}:\d{2}:\d{2}\.\d{3}\]\s+(.*)')
+    match = pattern.findall(output)
+    return match
+
+models = filtered_models
+
+# read the validation list
+manifest_data = []
+with open(validating_files, 'r') as file:
+    for line in file: 
+        manifest_data.append(json.loads(line))
+
+def calculate_wer(text, origin_word):
+    ref_words = origin_word.split()
+    hyp_words = text.split()
+
+    if not ref_words and not hyp_words:
+        return 0
+
+    elif not ref_words:
+        return float('inf') if hyp_words else 1
+    elif not hyp_words:
+        return float('inf')
+
+   # Initialize the dynamic programming table (list of lists)
+    d = [[0 for j in range(len(hyp_words) + 1)] for i in range(len(ref_words) + 1)]
+
+    for i in range(len(ref_words) + 1):
+        d[i][0] = i
+    for j in range(len(hyp_words) + 1):
+        d[0][j] = j
+
+    for i in range(1, len(ref_words) + 1):
+        for j in range(1, len(hyp_words) + 1):
+            if ref_words[i - 1] == hyp_words[j - 1]:
+                d[i][j] = d[i - 1][j - 1]
+            else:
+                d[i][j] = 1 + min(d[i - 1][j], d[i][j - 1], d[i - 1][j - 1])
+
+    wer = d[len(ref_words)][len(hyp_words)] / len(ref_words)
+    return wer
+
+avg_size = len(manifest_data)
+total_wer = 0
+for model in filtered_models:
+    for thread in threads:
+        for processor_count in processors:
+            for file in manifest_data: # we are running each iteration of the manifestation data
+                audio_filepath = file['audio_filepath']
+                audio_text = file['text']
+                sample_file_path = sample_folder + audio_filepath
+                print("printing out command:")
+                cmd = f"../build/bin/whisper-cli -m ../models/{model} -t {thread} -p {processor_count} -f {sample_file_path}"
+                process = subprocess.Popen(
+                    cmd, shell=True, stdout=subprocess.PIPE, stderr=subprocess.STDOUT
+                )
+                print(cmd)
+                output = ""
+                while process.poll() is None:
+                    output += process.stdout.read().decode()
+                final_word = filtered_text(output)
+                print(f"Word transcribed is : {final_word}")
+                print(f"Actual word is: {audio_text}")
+                if len(final_word) == 0:
+                    print(f"wer for {audio_filepath} is 1")
+                    continue
+                wer = calculate_wer(final_word[0], audio_text)
+                print(f"wer for {audio_filepath} is {round(wer,2)}")
+                total_wer += wer
+
+print(f"Final WER is {round(total_wer / avg_size, 2)}")
+
+
+